|
|
图1 语言速度场估计方法流程示意图
图2 古代农业中心和人群、文化、语言扩散模式
在国家自然科学基金项目(批准号:T2122007、32070577)等资助下,复旦大学张梦翰研究员课题组联合金力院士课题组,提出了推断语言扩散模式的新方法,重构了四大农业语言的传播模式。相关研究成果以“利用速度场估计方法推断语言扩散模式(Inferring language dispersal patterns with velocity field estimation)”为题,于2024年1月2日发表在《自然•通讯》(Nature Communications)杂志。论文链接:https://www.nature.com/articles/s41467-023-44430-5。
随着农业的发展,人类经历了大量的语言扩散、人口扩张和文化传播事件。研究语言扩散可以为探索人群活动和文化演变提供新的线索。传统的语言扩散研究通常采用谱系地理学方法,假设语言扩散过程符合谱系树模型,并利用随机游走推断祖先语言的地理位置。然而,语言在扩散的同时容易受到横向交流(语言借用和区域扩散)的影响,并不完全符合谱系树模型。因此,摆脱对谱系树的依赖成为准确重构语言扩散模式的重要挑战。
该团队利用物理学中的速度场理论和动力学方程、遗传学中的遗传突变模型、统计学中的马尔可夫过程以及经济学中的最优传输理论,建立了一种不依赖于谱系树的“语言速度场估计方法(Language velocity field estimation)”(图1),推断出语言扩散的路径和中心。在模拟验证方面,基于1000个已知扩散模式的模拟数据集,该团队证实了语言速度场估计的有效性和稳健性。
利用上述语言速度场,该团队进一步探究了四大农业语言的扩散模式(图2)。研究结果显示:印欧语系起源于新月沃土(欧洲的古代农业中心),向西传播至欧洲,向东传播至印度次大陆;汉藏语系起源于位于黄河流域的陕西省(马家窑和仰韶新石器文化中心),向西南传播至青藏高原,向南传播至东南亚大陆;非洲班图语系起源于喀麦隆与尼日利亚地区(非洲的古代农业中心),向东南方向传播至整个非洲中部、南部和西部;南美洲的阿拉瓦克语系起源于马德拉河流域(南美洲的古代农业中心),向北横跨亚马逊低地传播至沿海地区。这些结果表明,在过去一万年中,语言的扩散与人口扩张和文化传播密切相关。
该研究融合了多学科的研究方法,整合了多学科的证据,不仅为语言扩散研究提供了新的视角和方法,也为理解人群活动和文化演变提供了重要依据。