青春校园
首页 / 青春校园 / 正文
【科学网】新方法可实现多环境数据的全基因组关联分析

全基因组关联分析是在自然群体中将标记基因型与复杂性状表型关联以挖掘复杂性状基因的方法,在动物、植物、林木和人类遗传中广泛应用。近日,华中农业大学植物科学技术学院教授章元明团队在植物学领域期刊额《分子植物》(Molecular Plant)上发表了研究论文,报道了全基因组关联分析方法学研究的突破性进展。

该研究显著减少了混合模型中方差组分的数目,统一构建了关联分析主效位点、环境互作和位点间互作检测以全面剖析数量性状遗传构成的新框架,实现了从单环境数据关联分析到多环境数据联合分析的转变,为复杂性状基因发掘提供了新方法。

在QTN检测中,虽然关联群体标记通常有AA、Aa和aa三种基因型,应该估计加性与显性两种效应,但是目前几乎所有方法只估计等位基因替代效应,导致效应估计混杂和多基因背景控制不全面。在QTN×环境互作(QEI)和QTN×QTN互作(QQI)检测中,除上述问题外,还存在可供利用的方法十分有限的问题,导致了作物关联分析几乎是单环境数据分析或多环境BLUP值分析,少见QEI和QQI的应用研究报道。

在QTN检测全基因组扫描时,新提出的压缩方差组分混合模型首先估计标记基因型AA、Aa和aa的效应,然后将这些基因型效应估计值剖分为QTN的加性与显性效应。这种模型与该团队已提出的mrMLM方法结合,形成3VmrMLM方法。同时,这种方法延伸至QEI和QQI检测。由此,将QTN、QEI和QQI检测的5、10和15个方差组分混合模型统一压缩为3个方差组分的混合模型,构建了一个能检测各种位点并估计其效应的统一关联分析新框架。

在模拟研究中,3VmrMLM方法正确检测了所有主效与互作效应位点并渐进无偏估计其效应,具有高的检测功效、高的效应与位置估计精度和低的假阳性率。进一步研究表明了实际数据分析结果的可靠性和高的可重复性。此外,多环境数据关联分析新策略能更全面揭示复杂性状的遗传基础。

章元明领衔的统计基因组学团队多年聚焦于作物复杂性状基因发掘方法学研究,取得了一系列成果。在关联分析方面,最早提出关联分析混合模型方法,联合优化压缩混合模型方法,发展的一系列多位点方法已被广泛应用;在双亲分离群体基因发掘方面,提出了高功效检测小效应与连锁位点的GCIM方法、F2群体极端池基因快速检测的平滑LOD得分统计量以及将Bayesian估计似然化的惩罚最大似然方法,参与发展了多QTL检测的压缩Bayesian估计方法。

华中农业大学植物科学技术学院博士生李梅和博士后张亚雯为该论文的同等贡献第一作者,章元明为通讯作者,其R软件包即将在R平台上发布。研究获得了国家自然科学基金、华中农业大学中央高校基本科研业务费与人才引进启动费以及棉花生物学国家重点实验室开放课题的联合资助。

相关论文信息:https://doi.org/10.1016/j.molp.2022.02.012

https://doi.org/10.1093/bib/bbab596