我国学者利用人工智能精确求解多电子薛定谔方程

日期:2025-10-23  来源: 交叉科学部     作者: 王文冠 戴亚飞   【 】   【 打印 】  【 关闭

图 乾坤网络的架构图。(a) 用于构建电子波函数拟设的仅解码器Transformer架构,它将电子占据的轨道构型作为输入,输出波函数的振幅和相位。(b) 模型的训练流程,通过变分蒙特卡洛(VMC)方法对网络参数进行优化,以最小化体系的能量

  在国家自然科学基金项目(批准号:T2222026,92270001)等资助下,中国科学技术大学精准智能化学重点实验室商红慧特任教授、杨金龙院士团队将人工智能领域的Transformer深度神经网络架构与量子物理的基本方程相结合,发展了一种用于求解多电子薛定谔方程的乾坤网络(QiankunNet)。研究成果以“Solving the many-electron Schrödinger equation with a transformer-based framework”为题,于2025年9月29日在线发表在国际学术期刊《自然·通讯》(Nature Communications)杂志上,论文链接:https://doi.org/10.1038/s41467-025-63219-2。 

  薛定谔方程是量子力学的基本方程,从原理上讲,所有材料的性质都来源于多电子薛定谔方程的求解,因此精确求解该方程是整个物质科学领域的重大挑战之一。对于包含多个电子的复杂体系,求解薛定谔方程的计算量会随着电子数的增加呈指数级增长,这一“指数墙”问题极大地限制了传统计算方法的能力,使其难以精确模拟真实的分子体系和化学反应。为攻克这一难题,中国科大研究团队从人工智能领域的Transformer深度神经网络架构中汲取灵感,将其核心的注意力机制引入量子波函数的构建,利用其强大的关联建模能力捕捉电子之间的复杂相互作用。所构建的乾坤网络不仅在结构上实现了对电子波函数的精确表达,而且能够利用反向传播直接优化变分能量。研究团队还发展了一套结合了蒙特卡洛树搜索(MCTS)的高效自回归采样算法,该算法通过并行生成独立的、无关联的电子构型样本,避免了传统采样方法中存在的样本相关性高、收敛慢等瓶颈,极大地提升了计算效率和稳定性。同时,该框架还通过引入基于组态相互作用方法的物理启发初始化策略,显著加速了变分优化的收敛过程。

  研究结果表明,乾坤网络在包含30个自旋轨道以内的分子基准测试中表现优异,其计算的关联能精度达到了全组态相互作用(FCI)方法的99.9% 。在处理化学键解离等强关联问题时,乾坤网络展现出相较于传统耦合簇方法(如CCSD(T))更优越的性能。与之前的神经网络量子态方法相比,该方法不仅计算速度更快(在30个轨道时系统上快约10倍),精度也更高。 研究团队进一步将该方法应用于模拟生物氧化应激过程中的核心反应——芬顿(Fenton)反应,芬顿反应是一个包含过渡金属铁离子的复杂化学过程,乾坤网络模拟了[Fe(H2O)5(H2O2)]2+配合物中O-O键均裂的完整反应路径,准确描述了Fe(II)到Fe(III)氧化过程中的电子结构演化。这项研究为精确模拟复杂分子体系提供了新工具,也展示了人工智能方法在解决基础科学难题方面的巨大潜力。