大规模人群的全基因组测序研究有助于理解人类演化和迁徙的历史,以及发现与疾病相关的遗传变异。人类的遗传变异绝大部分为罕见变异,只出现在特定人群中。例如,国际千人基因组项目发现的8千多万个单核苷酸多态性(SNP)位点中,大约90%的最小等位基因频率(MAF)小于0.05,且86%仅出现在单一大陆人群中。然而,现有人类基因组学研究以及公共数据库的样本绝大部分来自欧美人群,所取得的研究成果并不完全适用于非欧美人群,严重限制了精准医学的实施和推广。
华中科技大学同济医学院,新加坡基因组研究所的研究人员发表了题为“Large-Scale Whole-Genome Sequencing of Three Diverse Asian Populations in Singapore”的文章,报道了对2780个新加坡华人,903个马来人,1127个印度人的全基因组测序数据的群体遗传学研究成果。
这一研究成果公布在10月17日的Cell杂志上,文章通讯作者为新加坡基因组研究所刘建军教授,第一作者为华中科技大学同济医学院王超龙教授,巫德刚,窦锦壮和柴晓冉,这项研究由同济医学院,新加坡基因组研究所与新加坡万人基因组联盟(SG10K Consortium)合作完成。
亚洲人口占世界总人口的60%,具有丰富的遗传多样性。新加坡由于其独特的近代移民史,形成了主要包括华人、马来人和印度人的人口组成,是亚洲人群遗传多样性的一个绝佳缩影,因此对新加坡三大族群开展全基因组测序研究将推进我们对亚洲人群特有的基因变异的了解,对精准医学在亚洲的发展具有重要意义。
这项研究通过对4810个新加坡人的13.7X全基因组测序,发现了89160286个SNPs和9113420个插入缺失变异(INDELs),其中一半以上为尚未在国际遗传数据库dbSNP记录的新发现变异,而且有126个被生物信息学软件预测为有害的变异从未在公共数据库中报道却在新加坡人群中达到了MAF>1%,从侧面反映了现有数据库中亚洲人群数据的严重匮乏,将影响对亚洲人进行疾病基因诊断的准确性。
基于上述数据,作者进行了深入的群体遗传学分析,证实了新加坡三大族群涵盖了广泛的亚洲人群遗传多样性,且每个族群内部还有更精细的群体遗传结构,并系统地刻画了三大亚洲族群的人口学特征和演化历史。另外,作者发现了20个可能受到自然选择的基因位点,包括13个新发现的候选位点,其中富集了此前被全基因组关联研究(GWAS)报道的与人类复杂疾病和性状显著相关的信号,揭示自然选择对人类表型多样性的形成具有重大影响。最后,得益于新加坡人群丰富的遗传多样性,作者通过评估实验发现结合国际千人基因组和SG10K的测序数据可以显著地提高绝大部分亚洲人群和大亚洲人群的基因型填补精度,尤其是对于罕见变异的填补,将有助于增强相关人群的疾病关联研究的统计效能,加速发现致病基因和药物靶点。
这项研究所产生的数据和结果有望成为推进亚洲人群遗传疾病研究和精准医学发展的一项重要资源。