关闭广告

《自然》刊发中国36个民族泛基因组参考,助解复杂疾病遗传因素

澎湃新闻12311人阅读

·研究表示,当基因个体来自代表性不足的中国少数民族群体时,我们会新发现一些基因序列,并找到一些缺失序列,这意味着我们或许会找到揭示人类进化的新线索,同时了解复杂疾病中的遗传因素。

6月14日,中国泛基因组联盟(Chinese Pangenome Consortium,CPC)发表了中国36个民族的泛基因组参考图谱——CPC序列。这项研究初步构建了我国人群的泛基因组参考图谱,揭示了中国人的基因组中隐藏着此前从未揭示过的基因序列。相关论文《A pangenome reference of 36 Chinese populations》已在《自然》(Nature)杂志发表,这也是中国学者领导的人群基因组研究首次登上《自然》。

相较于来自单一个体的基因组,泛基因组参考图谱范围更广泛,包含了一个物种或群体中所有基因组的全集。此次的CPC序列结合了来自中国36个少数民族的58例样本,证实了高质量的群体特异性基因组在遗传和医学应用中的必要性,帮助我们更全面地理解东亚人群,尤其是中国人群的基因组变异。


中国泛基因组联盟发表中国36个民族的泛基因组参考——CPC序列。图片来源:《自然》

研究人员表示:“人类基因组学正在经历一个重要的转变——从过去单一的参考序列发展为更加全面的泛基因组形式。众所周知,在基因组研究中需要提高不同祖先背景的代表性,但与欧洲人相比,在亚洲人中进行的基因组研究数量还是较少,这也是为什么在种族群体间,基因组变异存在着相当大的差异。”

据悉,中国人群泛基因组联盟(CPC)由复旦大学徐书华教授和西安交通大学叶凯教授联合国内26家单位发起。在第一期研究计划中,CPC对代表中国36个族群的58个样本采用最新的基因组测序技术进行了深度测序,结合最新的单倍型基因组组装方法,获取了116个高质量单倍型基因组,并以图基因组的方式构建了高质量中国人群参考泛基因组。

此次的CPC序列确定了1590万个基因小变异和78072个基因结构变异,其中590万个小变异和34223个结构变异未在最近发布的pangenome(一种新兴的基因组分析模式)文献中报道。约500万个碱基对新序列存在于95%以上的单倍型中,被视为中国人群基因组核心序列,并被认为可能与中国人群特有的生物学功能或表型特征相关。

研究表示,当基因个体来自代表性不足的中国少数民族群体时,我们会新发现一些基因序列,并找到一些缺失序列。缺失的参考序列中富含古代遗传的等位基因(一对染色体上相同位点的两个基因)和基因,这些序列变异与角化(指细胞在特定条件下发生变化,从而使其形态和功能发生改变)、紫外线辐射反应、DNA修复、免疫反应等有关,这意味着我们或许会找到揭示人类进化的新线索,同时了解复杂疾病中的遗传因素。

研究人员表示,在基因组序列比对中,使用特定种群的参考可以提高比对质量。“我们的CPC序列无疑提供了对亚洲人群,特别是中国人基因组变异的更全面的了解。” 在连续性和基本水平精度方面,CPC序列与当前的人类参考基因组版本——GRCh38旗鼓相当,甚至更胜一筹。与人类泛基因组参考联盟(Human Pangenome Reference Consortium,HPRC)的图谱相比,CPC参考图谱提高了东亚样本短读长的完美比对率(在短基因序列长度的情况下,CPC的比对效果相似性更高)。

“在本次研究中,我们还找到了3629个受CPC特异性(只在CPC序列中表达)古代基因渗透段(现代人类基因组中渗入的古代DNA片段)影响的基因,其中1211个具有潜在功能性影响。这些基因在外源糖醛酸化(脂溶性物质反应)、类黄酮(维生素P)代谢过程,以及抗坏血酸和醛酸(肝脏用来解毒的重要物质)代谢过程中发挥着作用。它们同时还与多种疾病相关,例如结直肠癌、乳腺癌、神经系统疾病等。”

此外,该研究确定了相当大比例的古代起源序列,其中还有一些此前未被HPRC数据充分覆盖的古代序列,研究人员强调:人类泛基因组参考联盟的下一步工作中有必要包含更多不同的亚洲血统样本。

不过,研究也指出,当前评估工具仍存在局限性,例如,在测序过程出现装配错误的情况下,评估软件无法确定正确的装配。此外,虽然长读长测序技术已经迅速发展,但由于成本问题,短读长测序依然是基因组学研究的主要手段。而目前,由美国加州大学圣克鲁斯基因研究所(University of California Santa Cruz Genomics Institute)的Benedict Paten研究团队开发的短读长测序映射工具Giraffe,在处理局部复杂的基因区域时还存在一些问题。随着泛基因组图谱的简化,完美匹配(覆盖图谱每个顶点的匹配)的读长比例持续下降,这表明基因组图谱的多样性也在减少。在将短读长测序映射到泛基因组上时,如何实现高效且准确的映射仍然是一个亟待解决的问题。

“我们的计划是生成500个个体的单倍型序列,这些序列将具有高质量、分阶段和染色体水平的特征,覆盖56个官方承认的民族,以及一些以前工作从未很好覆盖的未识别民族,例如夏尔巴人(Sherpa)、刀郎人(Dolan)、克里雅人(Keriyan)、僜人(Deng)和罗布人( Lop Nur)。此外,我们还在进一步对CPC基因组中的功能元件(如基因、调控元件和转录异构体)进行全面注释。”研究人员说,“我们期待中国泛基因组联盟作为全球人类基因组学力量的重要组成部分,为构建高质量的泛基因组参考文献,并将其应用于各种基础和临床研究项目做出巨大贡献。”

据悉,此项研究由复旦大学、西安交通大学、中国医学科学院等26家单位联合完成。复旦大学徐书华教授、西安交通大学叶凯教授、中国医学科学院褚嘉祐教授和复旦大学陆艳副教授为论文的共同通讯作者。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

铁汉高能进阶,坦克品牌双车成都车展首秀

油门到底ACC 浏览 16595

比亚迪秦L信息曝光 有望搭载第五代DM-i混动技术

行车视线 浏览 8633

回应美日韩军演 朝鲜火箭弹飞向“太平洋靶场”

环球网资讯 浏览 15235

66岁老汉成拆迁户暴富2年找了5任妻子:不合适就散

奇史殿堂 浏览 78876

“赌一个明天”,危险的电信诈骗诱惑

财经十一人官方 浏览 11640

俄媒:“瓦格纳事件”后,普京与绍伊古等安全部门负责人举行工作会议

环球网资讯 浏览 11581

边境移民矛盾持续发酵 美国会发生“内战”吗

齐鲁壹点 浏览 8766

2023全球车企销量榜前十,比亚迪第九,没有特斯拉

买车家 浏览 8735

又见爆雷:业绩大降七成,股价跌超40%创新低

中国基金报 浏览 10669

观众直呼淘汰!这个“混子”冠军,在《浪姐》直播舞台彻底现原形

娱乐圈笔娱君 浏览 7138

体坛:张琳芃最后一练回归打消疑虑,张玉宁次战肯定更受重用

直播吧 浏览 8748

商务部就荷兰半导体出口管制问题答记者问

商务部网站 浏览 11657

小法:温格和瓜帅最符合我的足球基因 如今也研究德泽尔比等教练

直播吧 浏览 8834

继续征服!36岁C罗又创纪录 连续12赛季进球20+

网易体育 浏览 22031

德国暂停60岁以下人群接种阿斯利康疫苗,坚持注射该疫苗者需自己承担后果

趣看热点 浏览 1151209

詹俊:国足暂排小组第二&主动权仍在手,对出线还是抱有幻想的

直播吧 浏览 8760

全国最年轻公安厅长 不再担任省发改委党组书记

上观新闻 浏览 73421

杨紫琼带小金人为父扫墓 手持香烛鞠躬显虔诚

网易娱乐 浏览 15809

无人机入侵柬埔寨 洪森:伊朗名将可是被无人机杀死的

枢密院十号 浏览 70349

莫雷诺晒与曹赟定合影:很高兴再次见面,祝你取得巨大成功

直播吧 浏览 15162

篮网主场111比89大胜黄蜂,哈登终于当了回包工头

趣看热点 浏览 21682
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1