词语意义而非表层统计特征是预测性语言加工的关键

人类以增量方式理解语言,随着每个新词的输入不断更新句子意义的表征。这些更新受每个被感知词与先前预期之间距离的引导——即预测误差。大型语言模型(LLM)与皮层活动之间的一致性启发了这样一种假设:皮层对预测误差的计算是基于表层形式的(Surface-based),由词形共现的统计模式驱动。相较之下,心理语言学模型则提出,预测误差的计算是基于意义的(Meaning-based),由词语语义驱动。我们使用...
神经科学

人类以增量方式理解语言,随着每个新词的输入不断更新句子意义的表征。这些更新受每个被感知词与先前预期之间距离的引导——即预测误差。大型语言模型(LLM)与皮层活动之间的一致性启发了这样一种假设:皮层对预测误差的计算是基于表层形式的(Surface-based),由词形共现的统计模式驱动。相较之下,心理语言学模型则提出,预测误差的计算是基于意义的(Meaning-based),由词语语义驱动。

我们使用具有歧义语义的多义词来区分这两类模型:如果预测误差是基于意义的,那么歧义将向意义表征中引入不确定性,从而影响预测误差;而如果预测误差是基于表层形式的,那么歧义将不会影响预测误差。我们考察了歧义如何影响句子加工过程中自定步速阅读时间和脑磁图(MEG)神经反应中的预测误差特征。结果表明,尽管基于大型语言模型的预测误差代理变量能够稳健地预测无歧义词的阅读时间和神经反应,但在存在歧义的情况下,它无法预测二者中的任何一个。

也就是说,预测误差的计算会受到词义不确定性的影响,这支持了基于意义的模型,并证实了词义在预测性语言加工中的关键作用。我们的发现凸显了大型语言模型作为人类语言能力计算机模拟模型时的一项重要局限。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.15.724229v1?rss=1

🏷️ 预测性语言加工 词义歧义 预测误差 语义表征 脑磁图 大型语言模型

Administrator 2026年5月16日
我们的博客
存档