我国学者在人脑与人工智能模型句法层级表征对齐研究方面取得进展

日期:2025-10-30  来源: 生命科学部     作者: 李伊然、田伟   【 】   【 打印 】  【 关闭

  在国家自然科学基金项目(批准号:32441106、32171039、T2421004)等资助下,北京大学方方教授、王茜副研究员团队与浙江大学丁鼐研究员、北京语言大学陆灵犀研究员、北京通用人工智能研究院王威研究员开展合作研究,在人类大脑与大语言模型(large language models, LLMs)句法表征对齐分析方面取得进展。研究成果以“Hierarchical Frequency Tagging Probe (HFTP): A Unified Approach to Investigate Syntactic Structure Representations in Large Language Models and the Human Brain(“层级化频率标记探针(HFTP)”通用技术,在同一计算框架下比较人脑与多种大预言模型的句法层级结构加工机制)”为题,被人工智能顶级会议NeurIPS 2025接收,论文链接为:https://arxiv.org/pdf/2510.13255。

  句法是语言结构与智能生成的核心支架。现代语言学之父诺姆·乔姆斯基提出的递归层级理论认为,句法加工使人类能够以有限规则生成无限意义。随着大语言模型在文本生成、翻译与推理中展现出接近人类的表现,一个根本性问题逐渐凸显:人工智能是否也具备类人的句法理解机制?

  方方教授团队基于层级化频率标记方法,创新性地开发了“层级化频率标记探针(HFTP)”通用技术框架。在人脑实验中,研究人员利用颅内立体脑电(stereo-electroencephalography, sEEG)技术,以毫秒级时间分辨率和毫米级空间定位精度记录了受试者在聆听句子时的神经活动。相较于传统脑电图和功能磁共振成像,sEEG直接记录大脑皮层局部场电位,避免了颅骨衰减和血流动力学延迟,为揭示句法加工的精细神经动力学提供了不可替代的技术优势。

  研究团队发现,人脑语言核心脑区在句子层级对应的1 Hz短语层级对应的2 Hz频段产生稳定的神经振荡响应,揭示了人脑对层级句法结构的频率编码机制;同时团队识别出三类功能性神经元群:分别特异性处理句子边界、短语边界,以及同时参与两级共享加工的神经元群体。人工智能模型实验中,研究团队为GPT、Llama、Gemma与GLM等模型构建了虚拟时间轴,并将模型内部激活信号映射到频域后,也发现了类人的句子、短语以及共享加工模式。结果表明人脑和人工智能模型在层级化句法加工上存在共通的结构节律。

  研究还发现,不同模型与人脑的对齐程度并不随模型迭代单调提升。例如,Gemma 2与人脑的相似性高于前代Gemma,而Llama 3.1则低于Llama 2。这一结果表明,模型性能的提升未必依赖更"类人"的机制实现。不同的智能体可能采用各自独立的结构策略达成语言理解的功能目标,这也暗示:人类智能可能并非智能涌现的唯一路径。

  综上所述,HFTP框架不仅为人工智能可解释性研究提供了新的定量范式,也为理解智能本质开辟了新的思考维度,有助于推动我们对智能多样性的深入理解。 


图 HFTP实验范式与三种不同句法层级编码计算单元定义