人才培养
首页 / 人才培养 / 正文
我校举办第二届基因组育种算法国际竞赛

南湖新闻网讯(通讯员 余梦琪 陈华夏 )2024年12月28日,第二届基因组育种算法国际竞赛颁奖典礼暨前沿论坛在我校第一综合楼A102顺利举办。本次竞赛由我校联合崖州湾国家实验室、上海人工智能实验室、湖北洪山实验室、华为技术有限公司等单位共同发起,得到了科技创新2030重大项目“智能设计育种技术创新与应用”的大力支持,以 “基因组育种‘从算法到应用’” 为主题,吸引了科研领域的广泛关注。

活动现场(侯国涛 摄)

据悉,本次基因组育种算法国际竞赛为第二次举办,自 2024 年 7 月启动以来,得到了全球各地科研团队的积极响应,共有 35 支队伍报名参赛。经过激烈角逐,最终6支实力强劲的队伍进入决赛答辩,分别来自浙江大学、西北农林科技大学、华中农业大学、中国科学院遗传与发育生物学研究所、扬州大学以及武汉科技大学。

本次大赛的评委老师分别是中国农业科学院作物科学研究所研究员徐云碧、北京市农林科学院信息技术研究中心张东峰、先正达科技有限公司姚骥以及我校专家教授,活动由李兴旺教授主持。

决赛现场,生命科学技术学院党委书记范金凤对各位老师同学的到来表示热烈欢迎,她表示,基因组育种算法竞赛为我们提供了一个集学术交流、技术研讨和实践应用于一体的平台。她希望各参赛团队能够尽情施展才华,勇于探索未知领域,攻克基因组育种难题,加速理论向实践应用的转化。植物科学技术学院肖英杰教授宣读了评选规则,评委老师从算法的创新性、计算的复杂度以及预测的准确性等方面进行打分。

西北农林科技大学的HoujiGBA-nwafu团队,采用可扩展和可成长的基础预测技术(EGGPT)。该集成算法涵盖数据收集层、数据处理层、数据编码层、基模型层和原模型层,相较于单一模型优势显著。通过与其他深度学习算法在整理性能和运算速度方面展开对比,利用训练好的模型预测,结果显示预测准确度与组委会提供的参考结果极其接近。

浙江大学农业与生物技术学院的Bioinplant团队创新地将分bin方法与混合线性模型相结合。该算法先对表型数据进行质控,剔除表型缺失个体,而后通过基因型编码获得SNP数据,再经分bin处理得到bin数据,最终借助5-fold交叉验证重复50次实现表型预测,选取了抽穗期、株高和穗重3方面综合表现优良的品种c,有效减少了预算时间。

来自华中农业大学DeepBio_Star团队提出GEG2P算法。他们首先划分训练群体和测试群体,通过多种方法充分提取基因型特征,接着利用遗传算法构建基于集成学习的GP模型,再通过遗传算法对权重进行迭代优化,训练出最优模型来预测测试集群体表型。对于后续优化,团队有着明确规划,计划通过迁移学习提升算法鲁棒性;运用自监督学习范式提高预测精度,并辅助重要SNP位点以增强算法实用性。

中国科学院大学遗传与发育生物学研究所GoodShooting团队设计出CLCNet模型。该模型基于染色体感知和对比学习,采用多层非线性映射。其核心模块包括染色体感知,将SNP根据染色体位置分组进行特征选择,以及多任务与对比学习的结合,通过计算样本间SNP的低维表示的欧式距离和表型值差值来更新模型。CSCNet有两个创新点:染色体感知模块充分考虑局部上位性群和连锁效应,能全面精准选择代表性的SNP;对比学习模块将多任务与对比学习相结合,使用自定义的对比损失函数,提高任务间的关联性。

来自扬州大学的YZU-GS团队提出了BMGS(Bin-based Meta GS)。该算法采用bin方法,把临近高度连锁的SNP标记合并成bin基因型,这里的bin特指物理上高度连锁的SNP标记块,而非分离群体中没有发生重组的染色体片段。此方法借助整个群体的数据评估SNP之间的相关性,可广泛应用于各种群体。从训练集不同方法五折交叉验证的结果来看,对于抽穗期、穗重两个性状,BMGS的表现要好于任一单一的GS模型,在株高性状上,BMGS的效果与最佳单一模型相当,这表明BMGS不仅有效,且在遗传力较低的性状上可能效果更好。

武汉科技大学的AIIF团队设计了基于坐标注意力的卷积神经网络,用于学习基因型与表型之间关系,实现了从原始数据中自动提取特征的端到端学习。团队将输入的基因型数据从一维向量转换成二维矩阵,便于信息提取,并创新性地引入坐标注意力模块(CA),分别对水平和垂直方向的特征进行处理,能更好地动态调整特征矩阵中每个特征的重要性。

最终,扬州大学YZU-GS团队、中国科学院大学遗传与发育生物学研究所GoodShooting团队并列获得二等奖,华中农业大学DeepBio_Star团队获得三等奖,浙江大学Bioinplant团队、西北农林科技大学HoujiGBA-nwafu团队、武汉科技大学AIIF团队获得优胜奖。大赛组委会为获奖同学颁发证书,并勉励同学们继续努力,进一步思考算法如何推动实际应用,找到创新性强、实用性高的优秀算法,加速科学理论向实际应用的转化进程。


评委为二等奖获得者颁奖(侯国涛 摄)

评委为三等奖获得者颁奖(侯国涛 摄)

评委为优胜奖获得者颁奖(侯国涛 摄)

本次活动中,4名特邀专家就基因组育种算法的研究进展和应用前景作主题报告。来自浙江大学的樊龙江教授报告围绕“基因组育种算法实践与思考”为题进行专题报告,他回顾作物基因组育种数据库的构建,分享“VarietyFace”平台的突破,对模型选择等挑战进行了深入思考。为基因组算法实践与发展提供思路参考。

扬州大学徐辰武教授则阐述“提高作物杂交种预测精度的统计新策略”,他借助遗传算法辅助的全基因组预测的策略的思路、适合度函数与数据集构建,介绍了代谢标志物辅助的全基因组预测模型,及其在玉米和水稻的实际预测应用的成果,展示实际应用成果。

北京市农林科学院信息技术研究中心的张东峰副研究员在“基于迁移学习的作物全基因组选择方法研究”报告中,介绍基因组迁移学习模型构建过程,探讨性状预测的准确性不同的性状进行融合微调模型与融合模型之间的相关性学习模型的复杂度与zero shot问题。

先正达生物科技(中国)有限公司的姚骥博士则重点介绍了“预测育种技术在先正达集团中国的可规模化应用”,回顾育种演变,以玉米与小麦为例,介绍数据驱动的可扩展预测育种范式,与基因组选择决定杂交种的群体组建与多目标优化的方法,提出未来应将环境因素纳入到模型中,实现二维数据到三维数据的转向。为预测育种提供新视角与方向。

本次竞赛暨前沿论坛受到科技创新2030重大项目智能设计育种技术创新与应用支持。

审核人:阎加培 李兴旺

 

 

收起 展开

最近新闻

单周单篇点击量排名