南湖新闻网讯(通讯员 王晨宇)近日,人工智能领域会议ECAI-2025(28th European Conference on Artificial Intelligence,CCF-B类)录用了我校信息学院本科生王晨宇(信科22级)、左朝颖(信科23级)和宿紫涵(生信23级)的综述论文,该论文以 “Deep Learning and Explainable AI: New Pathways to Genetic Insights”为题,分类梳理了各类应用于生信领域的可解释方法及其局限性,可帮助研究人员更好地理解各类模型及其可解释性。
深度学习模型已在生信领域中得到广泛应用。目前的主流方法包括在卷积神经网络(CNN)中通过卷积核可视化预测基因序列中的增强子,通过梯度传播的峰值预测启动子和沉默子区域之间的联系,通过基于扰动的方法敲除某个基因位点来预测其和某个生物特征之间的关联性,以及基于先验知识搭建透明模型如Dcell等来预测生物基因功能。

随着模型重要性日益凸显,迫切需要可解释方法来建立模型驱动决策的可信度。对于遗传学领域研究人员而言,从这些模型中获得可解释性见解,对从新视角理解生物过程具有重要价值。然而,目前基因组学中的可解释性分析主要依赖于直觉和经验,而非严谨的理论基础。

本综述中,研究人员将可解释方法系统分为基于输入的方法和基于模型的方法,并将基于输入的方法分为卷积核可视化、基于梯度方法和基于扰动的方法;将基于模型的方法分为利用注意力机制和基于先验知识的透明模型。此外,团队还通过具体生物学应用场景评估它们的局限性,例如由于Drop-Out机制引发的不同基因位点与同个生物特征相关。此外,文章还通过正式的数学论证建立了理论基础,给出了新颖的理解视角,例如通过微分几何观点理解神经元的冗余性,阐明这些局限性的根源,旨在帮助遗传研究人员更好理解和设计未来模型。

信息学院本科生王晨宇、左朝颖、宿紫涵为论文共同第一作者,信息学院张泽宇副教授、植科院王茂军教授为论文共同通讯作者。本研究由中央高校基本科研业务费专项资金,新疆维吾尔自治区财政科技项目,国家重点研发计划,国家自然科学基金的支持。
【英文摘要】
Abstract: Deep learning-based AI models have been extensively applied in genomics, achieving remarkable success across diverse applications. As these models gain prominence, there exists an urgent need for interpretability methods to establish trustworthiness in model-driven decisions. For genetic researchers, interpretable insights derived from these models hold significant value in providing novel perspectives for understanding biological processes. Current interpretability analyses in genomics predominantly rely on intuition and experience rather than rigorous theoretical foundations. In this review, we systematically categorize interpretability methods into input-based and model-based approaches, while critically evaluating their limitations through concrete biological application scenarios. Furthermore, we establish theoretical underpinnings to elucidate the origins of these constraints through formal mathematical demonstrations, aiming to assist genetic researchers in better understanding and designing models in the future. Finally, we provide feasible suggestions for future research on interpretability in the field of genetics.
论文链接:https://arxiv.org/abs/2505.09873
审核:张泽宇