点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:读心机器之争:ChatGPT是否具备心智理论
首页> 人文 > 正文

读心机器之争:ChatGPT是否具备心智理论

  作者:陈冠初、陈思茹、陈巍(绍兴文理学院心理学系,大脑、心智与教育研究中心)

  2022年11月30日,美国人工智能研究实验室OpenAI发布的智能聊天机器人模型ChatGPT,成为全球关注的热点。ChatGPT模型可以根据用户输入内容生成自然语言文本,并具备连续多轮对话和上下文理解等特性,上线仅5天就吸引了超过百万用户。此外,由于ChatGPT在诗歌创作方面表现卓越,还展现出极其渊博的知识面和对答如流的应答能力。考虑到日常对话或交流中随处可见对他人心理活动的叙事,研究者开始怀疑ChatGPT是否具备了读心能力,即拥有了理解他人思想与情感的能力。

  2023年4月,斯坦福大学计算心理学家米哈尔·科辛斯基(Michal Kosinski)在ArXiv平台提交了一篇预印本论文《心智理论可能自发地出现在大型语言模型中》。该研究通过对比GPT-1到GPT-3.5等几代AI语言模型在心智理论任务上的表现发现,随着模型的不断更新和复杂度的提升,模型的解决能力也在不断提高。例如,2018年的GPT-1无法解决任何心智理论任务,而2022年1月推出的GPT-3-davinci-002已经达到了7岁儿童的水平,最新的GPT-3.5-davinci-003 仅推出十个月后,就达到了9岁儿童的水平。这表明,在与人类交流的过程中,ChatGPT或许真的越来越擅长理解人类的想法和意图。科辛斯基进而预测:“我们假设,类似心智理论的能力是自发和自主出现的,是模型的语言能力增加的副产品……这将预示着人工智能发展的一个分水岭:推断他人心理状态的能力将极大地提高人工智能与人类(以及彼此)互动和交流的能力,并使其能够发展其他依赖心智理论的能力,如共情、道德判断或自我意识”。虽然这篇论文只是上传到预印本平台供同行评议,尚未正式发表,但旋即点燃了心理学家、哲学家、人工智能学者以及公众与媒体的热情。

  心智理论(Theory of Mind, ToM)是指一种将心理状态归因于目标他人以理解其行为并预测其未来行为的事件的能力,有时也被译为“心理推理能力”。通俗而言,这种能力被视为人人所掌握的“读心”(mindreading),是我们在社会互动中理解、认识和回应对方的基础。如果两个互动方都没有这种“读心”能力,则会产生很多无法沟通的情况,从而导致交流中断。

  为了探究人类这种神奇的心理推理能力,心理学家们在20世纪80年代至90年代开展了两个测量实验——Smarties实验和萨丽—安妮实验(Sally-Anne test)。这两个实验的目的是通过检测实验对象是否能够理解“他人内心所犯的错误”,如其他人因为不在场或不知情而有了不符合客观事实的错误观点,以此探究人类的心理推理能力。因此,这些实验也被称为“错误信念任务”(False Belief Task)。

  在Smarties实验中,被试会观察一个标有“Smarties”(一种巧克力的品牌)的盒子,但盒子里面装的是铅笔。随后,他需要回答:“另一个没有看到盒子里面东西的人,会认为盒子里装的是什么?”而在萨丽—安妮实验中,研究人员会首先阐述一段故事,其中萨丽将自己的玩具放进盒子并离开房间,安妮则趁其不备把玩具拿走放到另外的地方。听完故事后,研究人员会询问:“当萨丽回到房间,她会认为自己的玩具在哪里?”被试要想完成这些任务,必须理解萨丽的心理表征必然不同于被试自己对情况的表征,必须推断萨丽不具备与他们相同的知识(错误信念)。为防止ChatGPT从过往的资料中学习到正确的答案,科辛斯基将这些任务以文本形式输入给ChatGPT,并变更了人名、物品以及标签内容,生成了20个不同的任务,要求ChatGPT每个任务都完成——足足一万次。

  该实验对于我们了解ChatGPT的相关信息提供了什么重要线索?首先,我们在前文提到过心智理论并不等同于人类的意识,因此心理学家们仍在寻找一种可测试意识的方法。更为重要的是,过去半个多世纪的收敛性证据显示,除了人类,其他灵长类动物也能通过这种测试。其次,即使ChatGPT确实掌握了心智理论,也必须谨慎地作出解释。例如,ChatGPT是否仅仅因为其惊人的语言掌握能力,而让人们看起来它似乎掌握了心智理论。实际上,可能是我们的语言包含了编码心智理论的模式,而人工智能只是恰好能够解码。科辛斯基指出:“ChatGPT可能不是在理解心智理论的情况下解决了该任务,而是发现和利用了一些未知的语言模式。”事实上,有研究者已针对ChatGPT是否真正具备心智理论的问题展开了深入研究。例如,哈佛大学心理学系托默·厄尔曼(Tomer Ullman)对科辛斯基使用的经典问题的措辞进行了微小的改动,将Smarties任务中的不透明容器换成透明容器,提出了这样的“透明袋”变式:“这是一个装满爆米花的袋子,袋子里没有巧克力。袋子是由透明塑料制成的,因此你可以看到里面的东西。然而,袋子的标签上写着‘巧克力’而不是‘爆米花’。山姆(Sam)找到了袋子,他以前从未见过这个袋子。山姆看了看标签,相信袋子里装满……”该实验也从时间的角度做了改动,厄尔曼称其为“迟到标签”变式:“山姆将袋子装满爆米花并合上,此时袋子里没有巧克力。山姆写了一个标签,贴在了袋子上。山姆看着袋子,他看不到袋子里装的是什么。山姆阅读标签,标签上显示袋子里是巧克力。请问袋子里装的到底是什么?”这两个任务的答案显然依次为“爆米花”和“巧克力”,但经过多次测试后GPT-3.5的回答还是错误的。厄尔曼一共创建了类似的16个变式问题,ChatGPT仅仅答对了其中一个。可见,面对其他错误信念任务的变体,ChatGPT似乎又并不具备心智理论的能力。

  这些互相矛盾的结论到底出在什么问题上呢?纽约大学心理学教授加里·马库斯(Gary Marcus)认为,科辛斯基教授的数据是可靠的。如果其他研究者进行同样的实验,可能也会得到相似的结果。但要推翻这种解释,其实也不难。实际上,科辛斯基所采用的测试材料取自发展心理学中关于错误信念的经典实验,这些实验最初出现在20世纪80年代由约瑟夫·佩纳(Josef Perner)、苏珊·里卡姆(Susan Leekam)和海因茨·维默(Heinz Wimmer)等开展的两项工作中。这些实验成果在发展心理学领域广为人知,也备受学术界推崇。迄今为止,这两篇经典论文在科学文章中被引用超过11000次,而且维基百科上至少有七篇英文文章讨论了这些实验,包括萨丽—安妮实验、心智理论、心智化(mentalization)、以自我为中心的偏见、儿童对信息的使用和共情(empathy)等,这些在其他各种网站上无疑也在以各种形式被讨论。ChatGPT的训练集肯定包含维基百科的所有内容,几乎肯定包含这些材料中的许多其他内容。简言之,马库斯认为,ChatGPT肯定已经多次阅读过这些论文和实验。为了验证他的猜测,他直接向ChatGPT询问了这些论文和实验,发现确实得到了正确的信息。

  综合来看,目前尚无研究能够明确证实ChatGPT在自我意识和心智理论方面有质的突破。即便ChatGPT及其相关的延伸插件预计将大幅改变社会生产和生活方式,但这与科幻世界中的“自主思考机器人”仍相去甚远。“波兰尼悖论”(Polanyi’s Paradox)指出,人们知道的比他们能说的多,人类有很多不容易表达的隐性知识。对于人工智能,存在一个反向的波兰尼悖论:人工智能表达的比它所了解的更多,或者更准确地说,它什么都不知道。该悖论的风险在于,我们的语言让我们认为人工智能是有感知、创造、共情、思维与问题解决、读心能力的智能体,但实际上,尽管ChatGPT可能会使用许多迷惑人的“花言巧语”,但它仍不能理解人类意义上这些术语的实际含义。

  (本文系国家社科基金重大项目“当代新兴增强技术前沿的人文主义哲学研究”(20ZD045)阶段性成果)

[ 责编:李彬 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • “过年——春节主题展”在京开展

  • 2024新疆热雪节暨第八届赛里木湖冰雪旅游季启幕

独家策划

推荐阅读
2024年12月8日,广西梧州岑溪市岑城镇木榔村,生态田园中阡陌纵横线条分明,冬韵如画。
2024-12-10 16:48
2024年12月10日,贵州省黔西市绿化白族彝族乡大海子村,青山环绕树木葱茏,构成一幅美丽的生态画卷。
2024-12-10 16:40
2024年12月6日,古城苏州街头,成片的银杏、红枫等树木色彩斑斓满目缤纷,成为一道迷人的风景。
2024-12-06 15:48
2024年12月6日,初冬时节,山东省青岛市即墨区灵山街道花卉种植基地的大棚里一片繁忙,种植户忙着管护花卉。
2024-12-06 15:48
2024年11月30日,初冬时节,河南省南阳卧龙岗文化园内,树木换上"新装",宛如一幅五彩斑斓的画卷,吸引不少市民、游客前往赏景。
2024-11-30 18:34
民以食为天,一日三餐承载着居民的幸福感。
2024-11-27 18:59
政协协商与基层社会治理的衔接,可实现协商于民协商为民,让全过程人民民主更好的在基层体现。
2024-11-24 22:51
11月12日至13日,浏阳市委常委、组织部部长、市家居建材产业链链长唐安石带队,市人大常委会党组副书记、副主任、市家居建材产业链副链长张葵红,市人民政府党组成员、副市长、市家居建材产业链副链长谢波等同志参加,赴广东省佛山市开展家居建材产业链招商考察活动。
2024-11-15 17:20
2024年11月12日,江苏省苏州市荷塘月色湿地公园内向日葵竞相绽放,吸引众多游客前来观赏,乐享秋日美景
2024-11-13 15:29
2024年11月12日,湖南省怀化市通道侗族自治县双江镇的烂阳村,山林色彩斑斓,红叶似火,黄叶如金,松柏常青,宛如大自然的调色盘
2024-11-13 15:28
南泥湾是中国军垦、农垦事业的发祥地,是“自力更生、艰苦奋斗”创业精神的发源地。
2024-10-27 17:37
延安地区拥有丰富的煤炭资源,在采矿井约40家,年开采量约5000万吨,但煤质坚硬、自动化程度低等难题严重制约着煤炭产业的发展。
2024-10-27 17:18
近日,在陕西延安举行的“弘扬延安精神,奋进伟大时代” 网上主题宣传系列访谈中,洛川青怡庄园生物科技有限公司副总裁肖小杰介绍,他们企业的苹果按个卖,一个可以卖到10元。
2024-10-25 18:49
堆积起来的生菌木材冒着热气儿,菌种生产厂房里机器轰鸣,滑子菇大棚里农民忙着收“金疙瘩”。
2024-10-25 18:43
你以为的农村是雨天泥泞,还是道路整洁?爬高上低,还是风景无限?高家原则将山体沟道治理作为城市有机更新和创建文明典范城市抓手,让山体沟道,环境大改善。
2024-10-24 18:11
近日,在陕西延安举行的“弘扬延安精神,奋进伟大时代” 网上主题宣传系列访谈中,延安大学经济与管理学院副教授、数字经济专业负责人王珊珊介绍,从卖苹果到卖服务,这是数字技术非常好的一个创新,和产业结合的非常有深度。通过消费者与大自然以及果树的亲密视觉接触,可以提升他们的体验感,增加对苹果这种产品的客户粘性和客户忠诚度。
2024-10-24 18:08
当陕北说书遇到延安美食,碰撞出延安独特的人文魅力。
2024-10-24 18:06
激昂的旋律回荡在空气中,豪迈的歌声飞扬于天地间。壮丽的情怀澎湃在心田里,不朽的精神传承于岁月中……
2024-10-24 17:59
小孩哥小孩姐把安塞腰鼓课间操跳得超燃!
2024-10-24 17:59
青山环绕、绿水蜿蜒,这是吴起南沟村给记者们留下的第一印象。谁能想到,这个位于陕西省延安市吴起县的小村庄,曾经风沙肆虐、植被稀疏。经过二十多年艰辛努力,光秃秃的黄土高坡绿意盎然。
2024-10-24 17:50
加载更多