“可解释、可通用的下一代人工智能方法”重大研究计划系列成果八——
我国学者提出基于深度强化学习的癌症风险基因识别方法

日期 2025-07-08　来源：交叉科学部　作者：王文冠戴亚飞　【大中小】　【打印】　【关闭】

图基于深度强化学习的癌症风险基因识别方法总体架构图

　　在国家自然科学基金项目（批准号：92370132）等资助下，天津大学郝建业教授、西北工业大学彭佳杰教授、四川大学艾建忠教授联合团队提出了基于深度强化学习的风险基因识别新范式，并应用于肾透明细胞癌风险基因识别，成功发现并实验验证了EGFR和PCLO两个新风险基因，研究成果以“Identifying potential risk genes for clear cell renal cell carcinoma with deep reinforcement learning”为题，于2025年4月15日在线发表在国际学术期刊《自然·通讯》（Nature Communications）杂志上，论文链接：https://www.nature.com/articles/s41467-025-58439-5。

　　肾透明细胞癌（ccRCC）是一种在全球范围内较为常见的肿瘤类型，侵袭性强，30%以上患者在确诊或病程中发生转移，显著影响患者生存率。深入解析其发病机制并识别关键风险基因，对早期诊断和靶向治疗至关重要。然而，现有基于监督学习的风险基因识别方法依赖大量已知高置信度风险基因作为训练样本，而此类已知风险基因的数量十分有限，限制了此类方法的性能和应用。

　　为此，研究团队提出了基于强化学习范式的风险基因识别新方法RL-GenRisk，将风险基因识别建模为马尔可夫决策过程，通过构建基于蛋白质-蛋白质相互作用网络的交互环境，融合患者突变信息，持续产生学习数据，相比监督学习范式，解决了学习数据匮乏难题。研究团队进一步设计了融合专家知识的奖励机制，使生成的风险基因集覆盖尽可能多的患者，避免生成过长的基因导致模型识别能力下降。公共数据集上的大量实验表明，RL-GenRisk不仅在ccRCC高风险基因识别准确率超越了目前主流方法，还新发现了EGFR和PCLO两个风险基因，经生物实验验证和肾透明细胞癌显著相关，突显RL-GenRisk在癌症风险基因识别、靶点发现和治疗方面的重要潜力。

“可解释、可通用的下一代人工智能方法”重大研究计划系列成果八——我国学者提出基于深度强化学习的癌症风险基因识别方法

“可解释、可通用的下一代人工智能方法”重大研究计划系列成果八——
我国学者提出基于深度强化学习的癌症风险基因识别方法