尽管DNA测序数据在过去十年中有了巨大的增长,但我们对人类基因组的理解仍处于起步阶段。2019年10月22号,中科院上海生科院徐书华研究团队在Genome Biology上在线发表了题为PGG.SNV: understanding the evolutionary and medical implications of human single nucleotide variations in diverse populations的文章。研究人员开发了一个数据库PGG.SNV(https://www.pggsnv.org),该数据库为先前未被调查的亚洲土著人口提供了更高的权重。PGG.SNV在220,147个当前基因组和1018个古代基因组中存档了2.65亿个SNV,其中包括1009个新测序的基因组,代表了977个全球人口。 此外,PGG.SNV中提供了种群遗传多样性和进化参数的估计,这是与其他数据库相比的独特功能。在过去的二十年里,人类基因组序列的数量呈指数增长,这些序列是通过基因分型或下一代测序(NGS)技术产生的,这使得研究人员能够描述每种变异的功能后果,这是人类遗传学的基本目标。一般而言,实现这一目标的主要策略有三种:遗传方法、实验方法和进化方法。遗传方法,如连锁分析和全基因组关联研究(Gwas)可以识别候选变异,但通常没有足够的力量来确定因果变异,这主要是因为位于单个染色体上的变异之间存在连锁不平衡,而GWAS在解剖稀有变异方面的能力较小。传统的实验方法或分子生物学技术通常用于支持有限数量的特定表型的候选因果变异,并且在人类中难以实现。现在,由于高通量测序技术的迅速发展,对基因变异进行大规模的实验评估是可行的,这无疑促进了我们对人类功能元素/变异体的理解。然而,对于基因组功能的测定,一些实验方法仍存在争议。例如,ENDODE项目检测到的生物化学活性区域(例如,含H3K4me3的区域)覆盖了基因组中比进化保守区域大得多的部分,这就提出了非保守但生物化学活性区域是否真正具有功能的问题。尽管最近的一些实验方法,如大规模平行报告分析在识别表达调节变异体方面取得了成功,但它们还没有准备好应用于不同的人类群体。为了从群体遗传学和分子进化的角度来理解遗传变异的含义,在这里,研究人员开发了一个数据库PGG.SNV(https://www.pggsnv.org),该数据库为先前未被调查的亚洲土著人口提供了更高的权重。PGG.SNV在220,147个当前基因组和1018个古代基因组中存档了2.65亿个SNV,其中包括1009个新测序的基因组,代表了977个全球人口。 此外,PGG.SNV中提供了种群遗传多样性和进化参数的估计,这是与其他数据库相比的独特功能。原文链接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1838-5
(责任编辑:tqh)
Genome Biology | 新进展,徐书华团队建立全球不同人群单核苷酸变异数据库
287