【编者按】教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。近日,学校首期人才研修班在襄阳举办,研修班聚焦“坚持‘四个面向’强化人才在科技创新和拔尖人才培养中的引领驱动作用”主题,搭建思想碰撞、智慧交融平台。南湖新闻网特邀不同学科领域青年教师代表,结合研修所得与育人实践,畅谈对教育科技人才一体化改革发展的思考,为学校推进科技创新与产业创新融合、培养拔尖创新人才、建设特色鲜明世界一流大学注入更多智慧和力量。
7月19日至21日,学校在襄阳举办首期人才研修班。本次研修班的重要议题之一,是推进教育科技人才一体化改革,聚焦“农业人工智能+”拔尖创新人才培养。作为新进教师,结合工作岗位、科研经历和育人实际,分享个人的几点思考,以期携手培养更多拔尖创新人才。
我先讲一个故事。7月19日下午,我看到有朋友分享的Cell期刊论文,介绍了基于生成式蛋白质语言模型ESM-IF1、LigandMPNN和ProteinMPNN,通过引入蛋白质柔性区域、连锁不平衡和演化耦合的约束信息,实现了多类蛋白质的精准设计。这个故事在发表之前我有幸听过,我所在的人工智能生物学分会一直坚信AI生物学将成为重要的研究方向。该论文作者曾在2023年发表的一篇Cell论文中,利用AlphaFold2预测蛋白质结构并进行聚类,实现了碱基编辑酶的高效挖掘和设计。我当时读到这篇文章的时候觉得很有趣,这项工作是国内屈指可数的、由非生信学者做出的入选“中国生物信息学十大进展”的精彩研究。我给论文作者打电话就问一个问题:您的研究方向是基因编辑,那究竟是如何做出一流AI生物学工作的呢?电话那头,高彩霞老师笑着说:“我不怎么懂AI,但是对生物学熟啊;运嘉同学(高彩霞学生)也不怎么懂AI,但是会用AI工具嘛。”
这个小故事启发我培养拔尖创新人才,首要回答“做什么”。我的答案是,做你最擅长的。在多年的研究中,各领域里总会存在啃不动的“硬骨头”,对各种传统方法“免疫”的重要问题。这些问题通常很有价值,解决这些挑战性的“真问题”,需要前瞻性、交叉性思维,集众人之所长集体攻关。比方说,生物育种、兽农药研发中,有没有“既要又要还要”的难题?“既要又要还要”,在数学上是一个专业方向,叫“多目标优化”,目标是求帕累托最优解。这个方向相当难,很多人看不懂过于深奥的数学理论。但找出这些“既要又要还要”的难题,“做什么”已经解决了一半。要解决另一半,需要组里至少有一位能懂AI并且会用AI工具的学生,这个过程可以“以学生为主导”,充分发挥学生主观能动性,放开手让他们去想去闯去干。除了信息学院,大多数学院的同学可能只学过有限的计算机课程,感兴趣的学生,平时可通过网络自主学习了解AI的前沿技术,不断把最需要的锤炼成最擅长的,学会跨专业学习、跨领域生长。
第二,怎么做。学校目前大力推动“农业人工智能+”拔尖创新人才培养,相信未来在GPU智算算力的建设方面会有更大突破,让好战士配好枪,练成更多神枪手。目前,AI生物学有三种主流的研究模式。一是直接用AI技术来解决生物学难题。比方说,用卷积神经网络直接预测蛋白质结构(AlphaFold)、用扩散模型直接做蛋白质的从头设计(RFdiffusion,2024年诺贝尔化学奖得主David Baker的代表性成就),以及高老师2023年的Cell论文,用预测得到的蛋白质结构而不是序列进行聚类分析,从而印证了“结构决定功能”的生物学法则。二是将生物学的领域知识(Domain knowledge)与AI预测相结合。高老师今年刚发表的Cell论文,就是这类研究模式的典范。三是多种AI技术联用,构建混合型的AI架构来解决问题,鄙组的研究多数遵循此模式。上述三种模式,哪种好?具体问题需要具体分析。有充足的智算算力是重要前提和底气,给大胆创新更多试错容错空间,科学史上许多科研创新,特别是开创性、基础性的“0到1”的突破,往往都是试错试出来的,最开始的假设未必是对的。
第三,能做好。20多年前我读研究生的时候,国内生命科学研究各个方向力量都较弱,生信领域尤其欠发展。那时候我人生想得到的最大理想,就是退休的时候,中国的生信研究水平能够接近日韩,是断不敢想“超越”的。20年之后,当年一起努力的生信同行们突然发现,在各自的领域里,几乎都成为了领军者。回头看来时的路,每一步都不轻松,但是不积跬步无以至千里,支撑着走好这每一步的,恰恰是“能做好”的信念和信心。人嘛,总是要有理想的,今天创新的中国日新月异,我们的行业已经发生了翻天覆地的变化,我们不妨一起再定个目标:再用20年,站在世界之巅,为人类作更大的贡献。
(本文作者系洪山实验室、信息学院教授 薛宇 审核人 吴义生)