这几天新浪科技的微博在报道美国再一次“人机大战”的新闻,以前类似的有一条很著名的是IBM深蓝下国际象棋取胜了人类,这次是IBM的沃森在智力问答中取胜于其他两位人类选手。
刚才看到的一条微博是这样的:
@新浪科技:#人机大战#IBM超级电脑沃森昨天在智力竞猜节目中成功击败人类。其中一道问题是有关中文的。提问:这个语言的方言包括吴语,粤语和客家话。答案是:中文。但沃森可能没有很好的理解问题,包括把广东话作为了正确答案,因为广东话和粤语的关联度很高。
关于人工智能与中文两个字,看似不搭界,不过我联想到了一个思想实验——“中文屋”,也有被称为象形文字屋的,自维基百科上摘录如下:
中文房间的实验过程可表述为:一个对中文一窍不通的,以英语作母语的人被关闭在一间只有两个通口的封闭房间中。房间里有一本用英文写成,从形式上说明中文文字句法和文法组合规则的手册,以及一大堆中文符号。房外的人不断向房间内递进用中文写成的问题。房内的人便按照手册的说明,将中文符号组合成对问题的解答,并将答案递出房间。
约翰·希尔勒认为,尽管房里的人甚至可以以假乱真,让房外的人以为他是中文的母语用户,然而他压根不懂中文。而在上面的过程中,房外人所扮演的角色相当于程序员,房中人相当于计算机,而手册则相当于计算机程序。而正如房中人不可能通过手册理解中文一样,计算机也不可能通过程序来获得理解力。
在这里,我想到的是:作为一个使用中文的中国人,我们能说达到了“理解”汉字这个程度了吗?或者说,所谓的人类的“理解”究竟是什么?
我们如何解释词语?通常都是拿一个一句话来解释一个字,但这句话同样也是由其他字词句组成的。记得初中上的第一堂语文课上,老师就给我们说了古代人是如何解释字的:秋者愁也。完了,但愁呢?愁是什么?也就是说,中文乃至世界上其他语言,都是自我解释的。一个字不能独立拿出来不依靠其他字而获得解释。“象形”乃是汉字的基础。但一个圈一个点,既可以联想为太阳,也可以联想为眼睛或者球体,但古人为什么将一个圈一个点确认为是太阳呢?这就是一种约定俗成。
几年前我看过一个科技报道,说是外国科学家做了俩机器人,给他们设定了语言思维的程序,也加在了发出声音与接收声音的装置以及运动装置,但并没有输入语言库。也就是说这俩机器人是具有语言思维但不具备语言词汇的机器人。然后科学家让它们俩自己玩去,后来经过观察发现这两个机器人之间建立起了自己的简单沟通词汇,比如一个机器人抛掷小球时会发出一种声音,另一个就会理解并去接球,等等……由此看来,人类的语言可能就是从这样偶然和随机中产生的。在互相期待着沟通,并试图理解和反馈验证中建立起来的。
前几个月看了一本书《失控:全人类的最终命运和结局》它的开头章节,这是一本科学思想的书,而非科幻小说。我接受了其中关于“涌现”的说法,即一些秩序并非能用还原论的方式从其物质构成底层去寻找根源,但却可以因为量的累积而涌现出新的秩序。这些秩序在底层无法解释,但却确确实是存在。后来我在回顾自己高中时所写的《生死及其相关》时,发现当时我就隐约有了这样的思想。而且涌现的思想给意识与当前大行其道的唯物主义找了一个很好的平衡点,用我自己的话来说就是:心在物之间,不在物之内。
回到中文解释的这个话题:现在看来,可能语言也是从混沌、随机与偶然性中涌现出来的秩序,毫无道理也毫不理性,它就是出现了,并成为了人之所以为人的沟通方式。
也正是因为语言具有这样“靠不住”的起源,因此有种种语不达意的尴尬情况,也因此,佛家说“依义不依语”,“第一义不可说”、“禅本无言,言中藏禅”。
哟,本来只是想简单写一写,没想到胡思乱想却扯出了我从高中到现在就一直关注的各块思想领域。