编者按 人类进入21世纪,有两大秘密将要被揭开,一是生命的奥秘,二是心智的奥秘。美国为此推出两大科学计划――“人类基因组计划”和“人类认知组计划”。在这种前提下,以破解人类心智奥秘为目标的认知科学(Cognitive Science)越来越引起各国的重视。当前国际公认的认知科学的核心包括认知心理学、认知神经科学、计算机科学、语言学、人类学、哲学6个相关学科。这些相关学科互相交叉,又产生出众多的分支学科,如控制论、神经语言学、神经心理学、认知过程仿真、计算语言学、心理语言学、心理哲学、语言哲学、人类学语言学、认知人类学、脑进化等等。目前我国的认知科学虽然开展了一些学科领域的研究工作,但缺少多学科的协同研究。因此,亟需促进多学科的认知科学研究。本期“学术笔谈”特邀请中国社会科学院语言所、中国科学院心理所、清华大学等研究人员分别从语言、心理学、逻辑与认知等方面撰写文章,以向国内读者介绍认知科学的发展。 |
“认知语言学”的基本假设
沈家煊
■“认知语言学”不是语言学的一个分支,而是代表语言研究近年兴起的一个学派或思潮,是语言学内部的一种研究范式,其特点是着重阐释语言和其他认知能力之间密不可分的联系。 ■“认知语言学”的哲学基础是体验哲学,是一种“身心合一”或“心寓于身”的认知观。 ■“认知语言学”认为,对各种各样的语言现象都可以从认知上作出充分的解释,但是不可能做到完全的预测。在“认知科学”的新时代,“认知语言学”将为探索人类心灵的奥秘作出独特的贡献。 |
近年来在国际语言学界日渐兴盛的“认知语言学”是加引号的,有其特定的含义,并非所有关于认知的语言研究都是“认知语言学”。如果像“生成语言学”那样认为语言就是通过一些逻辑规则和客观的语义特征而“生成”的,而这些逻辑规则和客观的语义特征都以一定的心理表征形式储存在人的记忆中,从这一假设出发的语言研究自然也就属于一般意义上的认知语言学,但是跟这种有特定含义的“认知语言学”的基本假设却是大相径庭的。
“认知语言学”不是语言学的一个分支,而是代表语言研究近年兴起的一个学派或思潮。“认知语言学”也不是一种单一的理论,而是语言学内部的一种研究范式,其特点是着重阐释语言和其他认知能力之间密不可分的联系。这一研究范式发端于上世纪70年代,自80年代中以来,范围已扩展到语言学的各个领域,包括句法学、语义学、音系学、篇章分析等。“国际认知语言学学会”每两年举行一次会议,并出版《认知语言学》杂志。这个学派的代表人物有C.菲尔墨、G.莱考夫、R.兰格克、G.富高涅、L.塔米等。这些人各自的观点不尽相同,但对语言所持的基本假设却大同小异,只是在讨论和关注的具体语言现象上有所差别。
“认知语言学”认为,语言不是直接表现或对应于现实世界,而是有一个中间的“认知构建”层次将语言表达和现实世界联系起来。在这个认知中介层,人面对现实世界形成各种概念和概念结构。现实世界通过这个认知中介层“折射”到语言表达上,语言表达也就不可能完全对应于现实世界。举个简单的例子,现实世界中墙角并没有明确的边界,我们无法划出一条界线来确定墙角的范围,但是在语言表达上我们仍然说“一个墙角”和“在墙角里”,这是因为在认知上我们把墙角“识解”为一个有边界的事物,“墙角”因此是一个“有界”概念。
“认知语言学”的哲学基础是体验哲学,是一种“身心合一”或“心寓于身”的认知观。按照这种观点,心智和思维产生于人跟外部世界的相互作用,在这个相互作用的过程中人通过自己的身体获得经验,这种经验用“体验”称之最为恰当。例如,婴儿通过呼吸、进食、排泄而体验到“里”和“外”的概念对立,通过不断地抓起玩具而又放下的身体动作而体验到“控制”和“被控制”的概念对立。人的整个概念系统都植根于知觉、身体运动和人在物质和社会环境中的体验。“心寓于身”还有一层意思是概念和概念系统的形成要受人类身体构造的制约,例如人对各种颜色的分辨很大程度上是由人体视网膜的生理构造决定的。这种认知观跟“身心分离”的认知观相对立。按照“身心分离”说,心智和思维独立于人与外部世界的相互作用,也不受人类身体(如知觉系统和神经系统)的任何限制。人的心智和思维就是通过逻辑规则操纵一些抽象的符号,就像计算机操纵抽象的符号一样。
“认知语言学”认为人的语言能力依附于人的一般认知能力,语言能力跟一般认知能力没有本质上的差别,语言能力的发展跟一般认知能力的发展有极为密切的联系。例如汉语跟英语一样存在“辩论就是打仗”(Argument is war)这样一个隐喻,汉语有这样一些词语:“论战,争论,辩护,论敌,抨击,打笔仗,理论战线,唇枪舌剑,舌战群儒,入室操戈,大张挞伐,人身攻击,批评的武器”等等,这表明,我们不仅用打仗来谈论辩论,我们在实际辩论中就是有胜有败,把辩论的对方视为敌手,我们在辩论中的所作所为在很大程度上是受打仗这个概念支配的。因此,通常认为是一种特殊语言现象的“隐喻”其实不仅仅是语言行为,而是一般行为,受一般认知能力的支配。同样,“转喻”作为一种语言能力也跟一般认知能力分不开。说“回到原单位,看到的尽是新面孔”,用“新面孔”而不用“新四肢”、“新躯干”来专指“不熟悉的新人”,那是因为人一般都是靠观察脸相而不是靠观察别的身体部位来识别人的。这两个例子说明,语言能力在人的心智中并不自成一个独立的部分,而是依附于一般认知能力。因此这一假说不妨称作“语言能力依附说”,跟“语言能力独立说”相对立。按照“语言能力独立说”,语言能力在人的心智中自成一个独立的部分,并不依附于一般的认知能力,跟一般认知能力有本质的差别。
传统的语义学是一种客观主义的语义学,认为语义就是使语句表达的命题成真的必要充分条件,或称“真值条件”。然而“认知语言学”认为,语义不仅仅是客观的真值条件,还跟人的概念结构和概念结构的形成过程有直接的关系。“横看成岭侧成峰”,客观上是同一座山,由于人的观察角度的变化就形成两个不同的心理意象。这种观点可以称作“主客观合一”的语义观,跟“主客观分离”的语义观相对立。举例来说,“姑姑送一只花猫给小莉”和“姑姑送给小莉一只花猫”这两句话,客观情形都是姑姑把一只花猫送给小莉,但由于说话人观察的方式不同,凸显的部分不同,就形成两个不同的心理“意象”,前一句凸显的是花猫的转移过程,后一句凸显的是小莉对花猫的占有。
传统的范畴观认为范畴都是离散范畴,每个范畴都有自己的“界定特征”,符合某些“界定特征”的就成为某一范畴的成员,反之则不然。“界定特征”为范畴所有成员所共有,因此范畴内部各成员的地位是均等的。“认知语言学”则认为人建立的范畴,包括语法范畴,大多是“典型范畴”而不是离散范畴。范畴不能靠“界定特征”来界定,范畴与范畴之间的边界是模糊的,一个范畴内部各成员的地位是不均等的,有的是范畴的典型成员,有的是非典型成员。例如,麻雀、燕子、喜鹊等是“鸟”这个范畴的典型成员,鸵鸟和企鹅则是非典型成员,“鸟”因此是个典型范畴。语法范畴,如动词、名词、主语、宾语等等,跟其他范畴一样也都是典型范畴。从索绪尔开始,语言学家一直强调形式和意义之间联系的任意性,而“认知语言学”注重两者之间联系的“象似性”(iconicity),认为语言的这种“象似性”程度要比我们过去所想象的大得多。例如“我在马背上跳”是我先在马背上然后跳,“我跳在马背上”是我先跳然后在马背上,语句的词序“象似于”事件发生的先后顺序。
在强调“象似性”的同时,“认知语言学”又认为,由形式和意义结合而成的语言符号,从词素和词到短语和句子,都是大大小小的“构式”,“构式”是心理上的“完形”结构,其整体要大于部分之和,构式的意义因此不能完全靠其组成部分的意义推导出来。例如复合词“轮椅”,不是带轮子的椅子都叫“轮椅”,“轮椅”特指某一种带轮子的椅子。
“认知语言学”认为语言的演变也跟人的一般认知方式密切相关,例如“我不许他回家”和“他许是回家了”这两句话里的“许”字,前者表示“准许”,后者表示“或许”,即说话人的推测。后者是从前者通过词义的引申“虚化”而来的,这个虚化过程靠的是类推或隐喻,两者都表达“做X不受阻碍”,只不过前者是“某人做某件事情不受阻碍”,而后者是“说话人做某个论断不受阻碍”。
最后,“认知语言学”认为,对各种各样的语言现象都可以从认知上作出充分的解释,但是不可能做到完全的预测,这是语言学这门科学的研究对象的性质所决定的。凡是复杂和开放的系统都无法做到完全预测。语言是一个复杂系统,是许许多多方面和因素互相作用和综合的结果。复杂系统永远也不可能达到均衡的状态,它总是处在不断展开、不断转变之中。如果这个系统确实达到了均衡状态或稳定状态,它就变成了一个死的系统。语言也是一个开放系统,处于不断的演变之中,语言的形式和意义之间因此是一种不完全的对应关系。跟气象科学、进化科学、地质学和天文学一样,语言学虽然不能做到完全的预测,但仍然不失为一门科学。
“语言是洞察人类心灵的窗户”,在“认知科学”的新时代,语言学家将和其他科学家一道为探索人类心灵的奥秘作出自己的贡献。
情感计算
傅小兰
▲在人与计算机的交互过程中,计算机是否能够体会人的喜怒哀乐,并见机行事呢?情感计算研究试图对此作出解答。 ▲情感计算研究的发展在很大程度上依赖于心理科学和认知科学对人的智能和情感研究取得的新进展。 ▲通过计算科学与心理科学、认知科学的结合,研究人与人交互、人与计算机交互过程中的情感特点,设计具有情感反馈的人与计算机的交互环境,将有可能实现人与计算机的情感交互。 |
在较长一段时期内,情感一直位于认知科学研究者的视线以外。直到20世纪末期,情感作为认知过程重要组成部分的身份才得到了学术界的普遍认同。当代的认知科学家们把情感与知觉、学习、记忆、言语等经典认知过程相提并论,关于情感本身及情感与其他认知过程间相互作用的研究成为当代认知科学的研究热点,情感计算( affective computing )也成为一个新兴研究领域。
众所周知,人随时随地都会有喜怒哀乐等情感的起伏变化。那么在人与计算机交互过程中,计算机是否能够体会人的喜怒哀乐,并见机行事呢?情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统,即赋予计算机像人一样的观察、理解和生成各种情感特征的能力。
目前情感计算研究面临的挑战还很多,例如,情感信息的获取与建模问题,情感识别与理解问题,情感表达问题,以及自然和谐的人性化和智能化的人机交互的实现问题。显然,为解决上述问题,我们需要知道人是如何感知环境的,人会产生什么样的情感和意图,人如何作出恰当的反应。而人类的情感交流是个非常复杂的过程,不仅受时间、地点、环境、人物对象和经历的影响,而且有表情、语言、动作或身体的接触。因此,在人和计算机的交互过程中,计算机需要捕捉关键信息,识别使用者的情感状态,觉察人的情感变化,利用有效的线索选择合适的使用者模型(依据使用者的操作方式、表情特点、态度喜好、认知风格、知识背景等构建的模型),并对使用者情感变化背后的意图形成预期,进而激活相应的数据库,及时主动地提供使用者需要的新信息。
情感计算研究的发展在很大程度上依赖于心理科学和认知科学对人的智能和情感研究取得新进展。心理学研究表明,情感是人与环境之间某种关系的维持或改变,当客观事物或情境与人的需要和愿望符合时会引起人积极肯定的情感,而不符合时则会引起人消极否定的情感。情感具有三种成分:主观体验(个体对不同情感状态的自我感受)、外部表现(在情感状态发生时身体各部分的动作量化形式,即表情)和生理唤醒(情感产生的生理反应)。从生物进化的角度我们可以把人的情绪分为基本情绪和复杂情绪。基本情绪是先天的,具有独立的神经生理机制、内部体验和外部表现,以及不同的适应功能。人有五种基本情绪,它们分别是当前目标取得进展时的快乐,自我保护的目标受到威胁时的焦虑,当前目标不能实现时的悲伤,当前目标受挫或遭遇阻碍时的愤怒,以及与味觉(味道)目标相违背的厌恶。而复杂情绪则是由基本情绪的不同组合派生出来的。
情感是一种内部的主观体验,但总是伴随着某种表情。表情包括面部表情(面部肌肉变化所组成的模式),姿态表情(身体其他部分的表情动作)和语调表情(言语的声调、节奏和速度等方面的变化)。这三种表情也被称为体语,构成了人类的非言语交往方式。面部表情不仅是人们常用的较自然的表现情感的方式,也是人们鉴别情感的主要标志。通过使用特定的仪器,我们可以对面部的微小表情变化进行研究,甚至可以区分真笑和假笑:人在真笑时面颊上升,眼周围的肌肉堆起,大脑左半球的电活动增加;而人在假笑时仅有嘴唇的肌肉活动,下颚下垂,大脑左半球的电活动不明显。脸部运动编码系统FACS通过不同编码和运动单元的组合,可以在脸部形成复杂的表情变化,其成果已经被应用于人脸表情的自动识别与合成。
人的姿态即身体表情,一般伴随着交互过程而发生变化,并表达着一些信息。例如,手势的加强通常反映一种强调的心态,而身体某一部位不停地摆动则通常反映情绪紧张。相对于面部表情和语调表情而言,姿态表情变化的规律性较难获取,但由于人的姿态变化会使情感表述更加生动,因而研究者依然对姿态表情的测量表示了强烈的关注。
语调表情是通过语音的高低、强弱、抑扬顿挫来表达说话人的情感。在人际交往中,语音是人们最直接的交流通道。通过语音(例如,特殊的语气词,语调发生变化等)人很容易就感受到对方的情感变化,就像“你真行!”这句话,既可以表示赞赏,也同样可以表示讽刺或妒忌。情感语音研究目前主要侧重于情感的声学特征的分析。语音中的情感特征往往通过语音韵律的变化表现出来(例如,当一个人发怒时,讲话的速率可能变快,音量变大,音调变高等),但也可同时通过一些音素特征(例如,共振峰、声道截面函数等)表现出来。
在情感计算研究中还可以使用很多种生理指标,例如,皮质醇水平,心率,血压,呼吸,皮肤电活动,掌汗,瞳孔直径,事件相关电位,脑电EEG等。研究发现,惊反射可用作测量情感愉悦度的生理指标,而皮肤电反应可用作测量情感生理唤醒程度的生理指标。
很显然,开展认知科学研究不仅仅是为了满足人类智慧上的好奇心,更重要的是服务于人类,提高人类的生活质量。情感计算有广泛的应用前景。计算机通过对人类的情感进行获取、分类、识别和响应,进而可以帮助使用者获得高效而又亲切的感觉,并有效减轻人们使用电脑的挫败感,甚至帮助人们理解自己和他人的情感世界。计算机的情感化设计能帮助我们增加使用设备的安全性,使经验人性化,使计算机作为媒介进行学习的功能达到最佳化。在信息检索中,通过情感分析的概念解析功能,可以提高智能信息检索的精确度和效率。在电子商务领域,在设计购物网站和股票交易网站等时充分利用人的情感因素的作用,以改变客流量。针对人的肢体运动,可以设计一系列运动和身体信息捕获设备,例如,将智能座椅应用于汽车的驾座上,用于动态监测驾驶人员的情感状态,并提出适时警告。多模式的情感交互技术能构筑更贴近人们生活的智能空间或虚拟场景,而机器人、智能玩具、游戏等产业则能构筑出更加拟人化的风格和更加逼真的场景。
情感计算是一个高度综合化的研究和技术领域。通过计算科学与心理科学、认知科学的结合,研究人与人交互、人与计算机交互过程中的情感特点,设计具有情感反馈的人与计算机的交互环境,将有可能实现人与计算机的情感交互。情感计算研究将不断加深对人的情感状态和机制的理解,并提高人与计算机界面的和谐性,即提高计算机感知情境,理解人的情感和意图,作出适当反应的能力。
逻辑、心理与认知
蔡曙山
●在逻辑学中重新引入心理因素,使我们对与认知有关的推理形式有了一种新的认识。
●认知科学与逻辑学交叉产生出来的新领域和新学科称为认知逻辑,它不仅是一种有人在场的逻辑学,还与人的心理、经验、语言、文化密切相关,成为探索人类心智奥秘的有用工具。 |
20世纪逻辑学的发展如果用一句话来概括,可以说是心理学的退场和重新进入。
什么是心理学的退场?人们通常认为这是弗雷格所建立的数学逻辑所导致的结果。弗雷格在《算术基础》一书的序中所提出的研究数学哲学的三条原则中的第一条,就是要把心理学和逻辑学的东西区分开来,把主观和客观区分开来。他说:“在涉及数学真的时候,问题就会摆脱心理学的领域,而进入数学的领域。”弗雷格确实成功地将心理因素从他所建立的数学逻辑中排除出去了。这表现在他所建立的数学逻辑中,无论是语形还是语义,都是完全排斥心理因素的。
但这样认识还不是问题的全部。问题的另一面是将数学逻辑的真理普遍化和绝对化,即把数学逻辑当作理性思维的普遍规律,当作唯一的逻辑真理,同时也当作探求真理的有效工具。对数理逻辑的这种信条,在20世纪上半叶导致逻辑实证主义和分析哲学的兴起和繁荣。
到20世纪30年代,随着哥德尔定理的证明,人们发现弗雷格所建立的一阶逻辑并不能满足数学推理的需要,更遑论整个的理性思维。因此,人们开始寻求新的逻辑真理。首先,将弗雷格所发明的量词作用范围从个体扩大到谓词,得到高阶逻辑。一阶逻辑和高阶逻辑合称为经典逻辑,它的两个特征和前提是系统的演绎性和二值性。对经典逻辑增加各种非外延的算子,又得到各种扩充的逻辑理论,包括正规的模态逻辑和各种非正规的模态逻辑。对经典逻辑的两个前提的挑战则产生各种不同于经典逻辑的变异系统,包括直觉主义逻辑、多值逻辑、自由逻辑、相干逻辑、非单调逻辑、概率逻辑等等。我们把经典逻辑以及它的各种扩充和变异理论统称为基本逻辑,它构成现代逻辑的基础。
经过以上发展,到20世纪中叶,人们广泛使用这些基本的逻辑工具来研究语言学和哲学问题,一个变革的时代到来了。
20世纪40年代中后期,维特根斯坦在哲学领域掀起了一场革命。在《哲学研究》一书中,维特根斯坦以语言游戏论取代前期的逻辑图像论。维特根斯坦提出“语言的意义在于它的应用”,这标志着一种新的语言哲学理论的创立,也标志着逻辑实证主义和分析哲学的终结。50年代初,奥斯汀又完善了后期维特根斯坦的语言游戏论,建立了言语行为理论。这一理论标志着语言哲学的研究已经从语义学的领域扩展到语用学的领域,语言的使用者和各种语境因素开始进入语言哲学的视野。
在20世纪50年代后期,乔姆斯基在语言学领域发起了另外一场革命:他在彻底批判行为主义语言学的基础上,建立了心理主义语言学。乔姆斯基心理主义语言学具有以下特征:第一,它能满足因果性和可观察性的要求;第二,它能够解释语言的处理过程,使我们能够理解语言的生成和转换。在乔姆斯基的理论中,语法被看作是一种解析器,这种解析器是我们在话语理解中用来探求知识的心理装置。乔姆斯基的语言理论还要求它自身要符合经济原则和具有简单性,这也与心理因素有关。第三,它能够说明儿童语言能力的获得。乔姆斯基认为,在儿童语言习得中,学习只起次要的作用,而孩子与生俱来的先天语言能力才是决定性的。第四,它促进语言病理学的研究与发现,促使语言学的研究与心理学和认知科学相结合。
乔姆斯基心理主义语言学首先导致认知心理学的产生。哈佛大学的乔治・米勒正是在乔姆斯基语言理论的影响下,才创立了认知心理学这门新学科,从此成为认知心理学的领袖人物,并一直引导着心理学的发展方向。另一方面,乔姆斯基心理主义语言学还启发人们对生理学、病理学以及脑与神经的认知机能的研究。最终,这些发展导致20世纪70年代中期认知科学的产生。因此,在西方科学界,人们将乔姆斯基看作认知科学的第一代领袖。
在维特根斯坦的语言游戏论、奥斯汀的言语行为理论、乔姆斯基的心理主义语言学和认知科学中涉身因素的共同影响下,心理学与逻辑学重新交融,心理因素重新进入逻辑学的研究领域,并形成心理逻辑这门新兴的学科。心理逻辑是逻辑学与心理学(特别是认知心理学)交叉产生出来的新兴学科。里普斯举了很多心理学的证据来支持心理逻辑。沃森著名的纸牌游戏则生动说明人们的推理如何受心理的影响。心智的计算―表征理解(CRUM)是心理逻辑的一种重要的形式,它认为思维是心理表征以及在这些表征上计算过程的运算结果。CRUM是多种多样的,逻辑、规则、概念、类比、表象、联接是6种主要的途径。对于理解人类思维,目前还没有一种单一的计算―表征能涵盖人类思维的整个领域。CRUM是成功的,在说明心理学性能的理论能力和提高这些性能的实践能力方面,计算―表征方式都超过了它以前的所有关于心智的理论。但CRUM也是不完善的,并非人类思维和智能的所有方面都能完全由CRUM来加以说明。对CRUM的实质性挑战表明了将它与生物学和神经科学方面的研究以及思维和知识的社会性方面的研究进行整合的必要性。
心理逻辑与20世纪以来各种非心理逻辑的区别在于,由于在逻辑学中重新引入心理因素,使我们对与认知有关的推理形式有了一种新的认识。
维特根斯坦和奥斯汀让我们知道,语言的意义不仅与语言的形式结构和意义相关,而且与语言的使用者以及使用者的意向有关。如果在使用语言符号时,我们不仅考虑语言符号的空间排列关系和语言符号与现实世界的映射关系,还要考虑语言符号的使用者,我们就进入了语用学的领域。
在语用学的视野中,逻辑学重新获得人的维度。为什么这样说呢?我们知道,逻辑学是从来不关心人的,这来源于逻辑学根深蒂固的观念:逻辑要为思维立法!因此,逻辑学只有抽去人的因素,它才能适用于一切人!在传统逻辑和近现代逻辑中,人的因素都被排斥于逻辑学之外。亚里士多德三段论、假言推理、一阶逻辑都是与人无关的,因此,它们是适用于一切人的。但是,这种观念在语用学的领域却遇到了挑战!
从语用学的观点看,语句的意义与说话人、听话人、时间、地点和语境这些要素密切相关。例如,“他说他是好人”这句话有多重含义,语句中的两个“他”可能指同一个人,也可能是不同的两个人,这就要对这句话所在的语境或上下文进行分析,才能知道它的真正含义。1985年,约翰・塞尔和丹尼尔・范德维克建立了语用逻辑这样一种新的逻辑理论,并对言语行为语句特别是其中的语用力量做了深入的分析。他们的工作表明,逻辑的发展已经接受语用学的原则和方法,那种与人无关并且试图适用于一切人的逻辑理论已经受到根本的动摇,无人在场的逻辑学已经变成了有人在场的逻辑学。在认知科学的发展过程中,它的6个学科分支与逻辑学交叉,产生出哲学逻辑、语言逻辑、心理逻辑、文化与进化的逻辑、人工智能的逻辑、神经网络的逻辑等新的研究领域,其中一些已经发展成为新的逻辑学科。我们把认知科学与逻辑学交叉产生出来的这些新领域和新学科统称为认知逻辑。认知逻辑不仅是一种有人在场的逻辑学,它还与人的心理、经验、语言、文化密切相关。在新的世纪,随着认知科学的发展,随着人们对心智奥秘的探索,逻辑学这门古老而年轻的学科一定会再度焕发青春,成为探索人类心智奥秘的有用工具,成为与认知研究相关的崭新的学科。