Introduction
据估计,2010年有4800万对夫妇受到不孕症的影响,1990年至2010年间不孕症水平没有明显的改善[1-3]。在美国,12%的15至44岁的妇女生殖力受损。越来越多的夫妇依靠辅助生殖技术(ART)来怀孕和生育,2015年在美国共开展了231,936个ART周期[4]。
很大一部分的不育病例是由于遗传缺陷造成的。男性不育占所有不孕不育病例的50%[5],已知的遗传因素占男性不育病例的15-30%[6]。染色体变异[7]、倒位[8]、易位[9]、Y染色体微缺失[10]和基因突变(例如CFTR[11]中的单核苷酸变异(SNVs)是导致男性不育的主要遗传病因。在女性中,不孕是一种更加异质的情况。虽然遗传学显然起着一定的作用,但这些影响大多是多基因的,因此很难确定一个单一的遗传病因。最常见的两种影响女性不孕的因素,排卵功能障碍(25%)和子宫内膜异位症(15%)都具有家族性倾向,表明了遗传基础[12]。除此之外,性染色体的改变[13]和一些影响女性生育能力的单基因突变[14,15],导致了诸如促性腺激素性腺功能低下、卵巢早衰,子宫内膜异位症和多囊卵巢综合征([12])。
过去要对不育症进行明确的基因诊断,需要进行多项检测,这就使得这一过程既昂贵又缓慢。例如,在男性中,需要进行多种技术进行遗传学分析:通过染色体核型等细胞遗传学检测性染色体非整倍性;聚合酶链反应(PCR)的方法检测Y染色体微缺失;用Sanger 测序法检测CFTR基因突变。然而,对每个患者全部方法检测一遍是不现实的,因为成本过高[16]。而对女性患者来说,成功率取决于许多因素,年龄是最重要的。不育症的临床评估包括非常多样化的检测,包括血液和尿液激素水平,影像学,以及对一些病因不明的患者进行的染色体核型或特定基因测序等遗传检测等。
NGS(Next-generationsequencing)技术使多个基因上的变异可以一次性被检测到,从而促进了基因诊断技术在医学实践中得到常规应用。在如肿瘤学[17]和心脏病[18]等领域这已经成为现实,基因panel可以对疾病进行更加全面的评估。NGS也非常具有投入产出比,因为它可以通过多种生物信息学算法来检测非常不同类型的变异(例如,SNVs、小indels、Y染色体的大段缺失和性染色体非整倍体)。因此,我们介绍了一个针对不孕不育遗传分析的NGS panel和生物信息学流程。而且我们还对比了传统方法和NGS法所会花费的成本。
Results
设计基因Panel
为了最大化这个不孕不育遗传综合检测的临床效用,我们只关注被证明对不育表型有明显影响的基因。如果该基因的变异在多个人群中都会导致不育,且由不同实验室报道其与不孕有直接关系时,这类基因被分类为“诊断基因”;当该基因的变异被报道与不育相关,但因果关系尚未明确,这类基因被归类为“相关基因”。男性不育panel包括Y染色体微缺失,CFTR突变和性染色体非整倍体[6]。女性不孕panel包括性染色体非整倍体和反复妊娠失败相关的基因变异,包括血栓性疾病、原发性卵巢功能不全、多囊卵巢综合征和卵巢过度刺激综合征。基因列表以及它们的选择依据如Figure 1所示,Figure 2说明了实验及分析流程。
分析和临床验证
为了验证panel的性能和测序分析的灵敏性、特异性和准确性,我们对千人基因组(1000G)项目[20]中的24个样本进行了重新测序,其中SNVs和 DELs都是已知的。将这些验证样本的NGS结果与1000G的已知变异进行比较(Table 1),芯片分析和Sanger测序进行验证。结果显示,在千人基因组24个样本中,SNVs的灵敏性>99%,对INDEL>91%,特异性均>99%,SNVS和Indels的准确性分别为99.98%和99.42%。
为了测定CNV、性染色体非整倍性和Y染色体微缺失的灵敏性,我们使用了34个样本,包含38个已知变异。这些样本的已知变异是有限的,因此不能评估其特异性。分析正确检测到3/3 CNVs、19/19性染色体非整倍体和15/16 Y染色体微缺失(Figure 2)。在三例(NA 20435,NA 18333和NA 22031)中,NGS发现的Y染色体微缺失比之前报道的缺失小;然而,微阵列分析证实了先前报告的微缺失大小。在一个样本中(NA 20434),NGS数据位于之前报道的序列下游1.17Mbp处,微阵列分析证实了NGS的结果。样本NA 12662同时具有X染色体重复和Y染色体微缺失((22769319-27097245)X0);NGS结果发现了X染色体重复,但漏掉了Y染色体微缺失。因此,对性染色体非整倍性和CNVs的临床灵敏性为100%(22/22)。 Y染色体微缺失为93.75%(15/16)。
接下来,分析了携带17个已知SNVs/Indels的11个DNA样本(Table 2),其中16/17得到证实。样品NA 02795中报道了致病性变异GALT C.130G>A;P.Val44Met。然而,该变异未被NGS识别,Sanger测序也未检测到,因此,基于NGS和Sanger序列的一致性,灵敏性计算没有包含该变异。因此,验证样本中SNVs/indels的临床灵敏性为100%。
CFTR第8内含子5T多态(IVS8-5T)
先天性双侧输精管缺失的男性在CFTR基因第8内含子的剪接受体位点前发现不同长度的碱基T(5,7或9T)[21]。T的长度与第9外显子拼接效率有关。这种多态性在临床上是通过等位基因特异的PCR[22]检测到的。为了测定NGS panel对该位点的灵敏性,我们对千人基因组中的72个样本重新测序分析。以1000G数据为参考,NGS检测到了67/72。对有差异的5例进行Sanger测序,结果证明NGS数据的结果是正确的。因此,我们的方法检测CFTR IVS8-5T的灵敏性为100%。
FMR1检测
已知CGG三碱基的动态突变会导致脆性X综合征,等位基因的前突变与卵巢早衰的风险增加有关[23]。当前NGS技术基于对靶序列的杂交富集,因此不能准确量化重复序列的数量。因此,我们使用了已有的PCR扩增和毛细管电泳检测CGG重复序列的方法[24],作为NGS对FMR1变异的检测的补充。通过对26个含有不同长度CGG扩增样品的分析,我们准确的检测出了“全突变”(CGG重复拷贝数>200),“前突变”(55