科学研究
首页 / 科学研究 / 正文
我校学者提出“课程式训练”新方法,显著提升符号图神经网络预测精度助力性状遗传解析

南湖新闻网讯(通讯员 张泽宇)在作物育种中,研究人员常通过构建“基因-性状关联网络”来解析基因如何正向或负向调控性状。然而,这些网络中的正负关系复杂交织,传统方法难以准确建模。研究团队提出的CSG(Curriculum representation learning for Signed Graphs)方法,通过让模型“先易后难”地学习,有效解决了符号图中“不平衡三元组”带来的学习困难问题。实验表明,该方法在多个真实数据集上提升了SGNN模型的预测精度,该方法可以用于作物基因-性状关联预测,为作物智能设计育种提供了有效的工具。

近日,华中农业大学棉花遗传改良团队王茂军教授课题组在人工智能期刊Neural Networks发表了题为Enhancing signed graph neural networks through curriculum-based training的研究论文,通过让模型“先易后难”地学习,有效解决了符号图中“不平衡三元组”带来的学习困难问题,并扩展到更复杂的环结构。实验表明,该方法在多个真实数据集上提升了符号图神经网络(SGNN)模型的预测精度,最高可达23.7%,可为复杂性状遗传解析和智能育种提供可靠的工具。

从“随机喂数据”到“有策略地学”:新方法让AI更懂正负关系。当前,SGNN模型在训练时通常将所有边(如“基因A促进性状B”或“基因C抑制性状D”)随机输入,忽视了不同关系的学习难度差异。CSG方法首次提出一种基于结构难度的“课程式训练”策略:通过分析每条边是否属于“不平衡三元组”(如A→B为正、B→C为正、但A→C为负的矛盾结构),为其赋予难度评分,并引导模型先学习简单关系,再逐步处理复杂关系。

“就像教孩子先学加减再学微积分,我们的方法可以让AI先掌握清晰的基因与性状关系,再攻克模糊复杂的调控机制。”论文第一作者张泽宇解释道。在六个真实符号图数据集上验证了CSG的有效性,包括比特币交易信任网络、社交网络中的朋友/敌人关系等,还可以扩展到作物基因-性状关联的数据集。结果显示:在SGCN、SNEA、SDGNN等五种主流SGNN模型上,CSG平均提升AUC指标5%-23.7%,同时降低标准差1.2%-8.4%,显著增强模型稳定性。

华中农业大学信息学院张泽宇副教授为论文的第一作者,王茂军教授和李嘉位博士为论文的共同通讯作者。新西兰奥克兰大学Kaiqi Zhao教授,成都电子科技大学朱晓峰教授,美国伊利诺伊大学芝加哥分校Philip S. Yu教授参与指导了该项研究。该研究获得国家自然科学基金、新疆科技厅重大项目、多模态人工智能系统全国重点实验室开放课题等资助,将为人工智能辅助精准育种提供了新的技术路径。

原文链接:https://doi.org/10.1016/j.neunet.2025.107975

审核人:王茂军

 

 

收起 展开

最近新闻

单周单篇点击量排名