南湖新闻网

首页 > 新闻 > 科学研究 > 正文

我校精准营养与代谢团队揭示哺乳动物假基因的演化和功能

核心提示: 2022年11月8日,我校生命科学技术学院、生物医学与健康学院精准营养与代谢团队陈振夏课题组在国际学术期刊Genome Biology在线发表最新研究成果,该研究系统地分析了人和小鼠基因组中假基因的演化历程、表达模式、在发育过程中的转录调控、翻译活性以及在癌症中的功能。该研究鉴定到一批参与复杂调控网络并有潜力作为癌症生物标志物的假基因,为后续表型和机制研究奠定基础。

南湖新闻网讯(通讯员 钱胜)2022年11月8日,我校生命科学技术学院、生物医学与健康学院精准营养与代谢团队陈振夏课题组在国际学术期刊Genome Biology在线发表题为“Evolution and function of developmentally dynamic pseudogenes in mammals”的论文。该论文系统地分析了人和小鼠基因组中假基因的演化历程、表达模式、在发育过程中的转录调控、翻译活性以及在癌症中的功能。该研究鉴定到一批参与复杂调控网络并有潜力作为癌症生物标志物的假基因,为后续表型和机制研究奠定基础。

假基因是指基因组中与蛋白编码基因序列相似,但不能转录翻译和缺乏功能的DNA片段。因而假基因长期以来被认为是基因组中演化的遗迹和无功能的化石。随着近些年来分子生物学技术和高通量测序技术的发展,某些假基因被发现能够转录甚至翻译产生完整的蛋白,并具有重要的功能,如原癌基因的激活、三维基因组构象调控,参与个体的生长发育进程。尽管个别的有功能的假基因被报道,对于假基因整体的表达和演化调控仍然是未知的。对于人类基因组中占基因数量1/4的1.4万个假基因,其演化起源时间、表达活性以及在发育和癌症中的功能等问题仍然有待探究。本研究利用发育的转录组数据和表观调控组学数据对上述问题进行了系统地分析。

首先,研究者对人和小鼠基因组中的假基因的起源时间进行了分析。结果表明,假基因在灵长类和啮齿类中爆发式产生,并显示了较强的演化保守性。产生时间更早的假基因比最近产生的假基因的序列保守也更强,但都强与随机选择的基因间区序列,暗示这些假基因受到自然选择的约束。

随后,研究者利用三代测序和时间序列的二代测序数据,并发现大量的假基因都是可以表达的,以FPKM > 0.1为表达阈值,其中有超过50%都是可以表达的,显著高于之前的预期。且基于假基因表达量的主成分分析(PCA)聚类结果显示样本按照组织聚类,这与蛋白编码基因的聚类模式相似,表明假基因可能参与组织特异性的功能建立。

研究人员根据假基因在发育过程中的表达波动情况,进一步鉴定了在发育过程中动态表达的假基因,结果表明这些假基因活性程度更高,启动子区有更多转录因子结合,参与更广泛的RNA-RNA交互,也更容易具有翻译活性,表明这些动态表达的假基因很有可能是有功能的。此外,研究人员还研究了假基因在17中癌症组织中的表达水平,筛选到一批作为癌症标志物或靶标的假基因候选物(图1)。

图1.假基因在癌症中的表达情况

图1.假基因在癌症中的表达情况

我校生命科学技术学院、生物医学与健康学院、湖北洪山实验室博士生钱胜为论文第一作者,陈振夏教授为论文通讯作者。该项工作得到了国家自然科学基金、湖北省科技重大专项、湖北洪山实验室基金、中央高校基本科研专项资金、华中农业大学-中国农业科学院深圳农业基因组研究所合作基金和华中农业大学科技自主创新基金等项目的资助。

【英文摘要】

Background

Pseudogenes are excellent markers for genome evolution, which are emerging as crucial regulators of development and disease, especially cancer. However, systematic functional characterization and evolution of pseudogenes remain largely unexplored.

Results

To systematically characterize pseudogenes, we date the origin of human and mouse pseudogenes across vertebrates and observe a burst of pseudogene gain in these two lineages. Based on a hybrid sequencing dataset combining full-length PacBio sequencing, sample-matched Illumina sequencing, and public time-course transcriptome data, we observe that abundant mammalian pseudogenes could be transcribed, which contribute to the establishment of organ identity. Our analyses reveal that developmentally dynamic pseudogenes are evolutionarily conserved and show an increasing weight during development. Besides, they are involved in complex transcriptional and post-transcriptional modulation, exhibiting the signatures of functional enrichment. Coding potential evaluation suggests that 19% of human pseudogenes could be translated, thus serving as a new way for protein innovation. Moreover, pseudogenes carry disease-associated SNPs and conduce to cancer transcriptome perturbation.

Conclusions

Our discovery reveals an unexpectedly high abundance of mammalian pseudogenes that can be transcribed and translated, and these pseudogenes represent a novel regulatory layer. Our study also prioritizes developmentally dynamic pseudogenes with signatures of functional enrichment and provides a hybrid sequencing dataset for further unraveling their biological mechanisms in organ development and carcinogenesis in the future.

论文链接

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02802-y

审核人:陈振夏

 

责任编辑:匡敏