新一代AI热度持续走高,以ChatGPT、GPT-4为代表的生成式人工智能(GAI)点燃了AI界的全民热望,大语言模型不仅可以生成高质量的文本,执行翻译、编程、诗歌创作等多样化的任务,答案的准确率也到了难以置信的新高度,意味着人工智能开启了全新的时代。然而大语言模型产品“时而神时而鬼”,又时常“一本正经地胡说八道”,出现人工智能幻觉。大语言模型真的理解人类语言了吗?8月24日,在江苏师范大学语言能力省部共建协同创新中心主办的“大语言模型离人类语言有多远:新一轮科技创新与产业革命的风口”学术研讨会上,来自清华大学、北京大学、百度、科大讯飞、出门问问等数十家高校、科研机构和企业界的近百名专家学者和业界人士聚集在一起,围绕这一议题展开了热烈讨论。
研讨会召集人、江苏师范大学语言能力协同创新中心主任杨亦鸣教授指出,不同于以往模型需要依赖标注大数据,大语言模型克服了知识瓶颈,仅需要少量微调就能应用到特定应用领域,表现出超强的学习迁移能力。ChatGPT已经跨越了智障阶段,进入了情感陪伴和智力共生阶段,一种可以逐步“解放大脑”的智能型生产工具已出现,人的脑力效率将得到极大提高。百度、科大讯飞和出门问问等公司技术掌门人纷纷介绍了百度公司的知识增强大语言模型“文心一言”、科大讯飞的星火认知、出门问问的一站式AIGC产品矩阵为代表的生成式人工智能大模型,在逻辑思考、数学证明、智能编程、文档问答与摘要、图表生成、图片理解等领域展现出惊人的天赋与优良的性能。大语言模型不仅学习并存储世界知识,更能学习得出合乎逻辑和常识的结论。
清华大学人工智能研究院常务副院长孙茂松教授认为语言生成模型之所以具有强大的生成能力,其深刻内因在于它使用了向量语言,进而可实现“万物皆向量”。ChatGPT是人类科技发展史上的重大突破,开启了全球第四次科技革命——“智能化”——的浪潮。
在人们享受着大语言模型带来的工作效率大幅提升的同时,面对大语言模型在基本常识、推理上“一本正经的胡说八道”的现实,却也不免使人忧思重重。北京大学计算语言学研究所副所长詹卫东教授对大语言模型进行了智能水平测试,发现大语言模型表现出明显的计划能力缺陷。通过不断扩大参数规模,大语言模型也仅只是减少了“幻觉”,强化学习医治得了“一本正经”,却不能根治“胡说八道”。大语言模型理解生成的“语言”语义和人类语言的语义理解相去甚远,向量语言与人类语言鸿沟仍难逾越。
人类有着天赋的语言机制,这一机制有许多大语言模型无法模拟的方面。江苏师范大学吴燕京教授研究表明人类与生俱来的“语言习得装置”接触少量语言刺激即可习得相应的语言能力,人类语言习得并非基于大数据的训练。浙江大学生物医学工程与仪器科学学院研究院丁鼐教授的实验结论也显示大语言模型对形容词的理解能力与人脑存在明显差异。北京师范大学认知神经科学与学习国家重点实验室丁国盛教授认为,大语言模型比之以往是一个非常大的超越,但和人相比还是不足,大语言模型不能真正理解语义。
杨亦鸣教授指出,究其本质,大语言模型的语言“创新”与人类语言的创新存在本质区别。大语言模型是将人类加工过的语言及其衍生品(文本、图片等)转化为数字信息并依据同现概率等统计信息进行进一步处理的,大语言模型涌现能力的呈现依然受人类的影响,如人类对度量方式的选择、微调指令的不同等,而非模型特性上的根本性变化,这与人类语言所呈现的自主创新存在本质不同。洪堡特早就说过,“语言产生自人类的内在需求”,即人类内在精神需求驱动其载体——语言的创新,人可以说出想说的内容,婴幼儿能够说出之前没听过、没说过的言语,每次语言行为的结果(语言作品)都是创新的,是自主创造的,不是数据的重复。
北京外国语大学王克非教授、武汉大学赵世举教授等也指出,正是由于大语言模型与人类语言存在本质不同,过度依赖大数据和云计算也造成了大语言模型面临的问题,如能源消耗过高,数据资源即将耗尽,价值观、道德观的偏离,由于自我监督缺乏而导致的“一本正经地胡说八道”等问题。
如何解决上述问题,大语言模型的发展与革新路径在哪?模仿“语言脑”或可成为一个解决方案。正如中国科学院院士、清华大学人工智能研究院院长张钹教授所指,大语言模型可以预见的未来之一是沿着当前路径,扩展多模态,扩大模型规模,研究与发展GPT语言,但其生成式方法的局限性决定了大语言模型并不适用于确定性答案、逻辑推理等语言应用领域,其根本原因可能源于大语言模型与人脑在运作机制上的差异。杨亦鸣教授指出,人脑“预装”的语言机制是大语言模型难以超越人类语言的根本原因,从分子、细胞、行为、功能层面开展全方位的语言脑机制研究,破译人脑语言加工之谜,以此建构可以“预装”的“语言脑”,可能是我国人工智能发展的一条创新路径。开辟独创独有、引领发展的科技创新方向,或可突破目前的大语言模型的局限,进一步解决人工智能本身机理不清问题,抢占下一代人工智能战略制高点,才有可能真正模仿类人智能,实现真正的通用人工智能。
与会专家同时呼吁,应当进一步深化人工智能技术与脑科学、语言学多个领域合作,推动AI更好地理解语义、理解目的及上下文、理解逻辑推理做出更为“人类”的回答。