在 Ricky Ramon 7 岁时进行一次例行检查中,犹豫不决的儿科医生送他去拍一张胸部 X 光片,结果显示在他心脏左上腔里有一个良性肿瘤。对于 Ramon 来说,这是长达二十年的痛苦而漫长的就医史的开始——伴随他 20 年的,是没完没了的预约、诊断、和手术。
在此期间,非恶性肿瘤不断重新出现在 Ramon 的心脏和整个身体中 – 在垂体腺中,肾上方的肾上腺,甲状腺结节。。。麻烦的是,医生无法诊断他的病情。当拉蒙 18 岁时,医生认为他的症状可能是 Carney 综合征—— 一种由 PRKAR1A 基因突变导致的遗传病症。然而,Ramon 的 DNA 测序结果显示该基因没有发现会导致疾病的变化。
八年后,斯坦福大学医学院的研究人员使用 PacBio 长读测序重新对 Ramon 的全基因组进行测序,发现了八年前 NGS 未能检出的重要缺失,进而确定了对 Ramon 的诊断。长读测序鉴定出 Ramon 基因组的一段约 2,200 个碱基对的缺失,并证实 Carney 综合征的诊断确实是正确的。这是第一次长片段全基因组测序应用于在临床,研究人员在 6 月 22 日 Genetics in Medicine 在线发表的这篇论文。
拼图中的漏洞基因组测序简单来说,就是将基因组 DNA 切割成碎片,读取碎片的序列片段,然后使用计算机将序列片段拼接在一起。之所以要那么麻烦切割为碎片,是因为现有的测序技术没法儿通读太长的序列,只好把全基因组打成小碎片分别测序。新一代测序技术(NGS)使得短片段的高通量测序变得 so easy,但是数据拼接却成了大难题。这有点像将一本厚厚的巨著撕成碎片,读取每个碎片上的字 / 词组 / 句子后,再设法拼接回一本书。碎片越小,拼接越困难得多。特别是这大部头 “巨著” 里的一些 “字”“词组” 或 “句子” 经常重重复复出现或者丢失,太小的碎片定位就几乎成为不可能。
八年前 Ramon 的基因组测序所使用的新一代测序技术(NGS)属于短读序列测序,每次能读取 100 个左右的碱基对,两端双向测序最长能测到 250 碱基对左右。这相对于 30 亿碱基对的人类基因组来说,其拼接难度之大,无法定位的漏洞之多,可想而知。八年之后重新测序 Ramon 基因组的 PacBio 长读测序技术一次可读取长达数万碱基的片段,这使得可以将基因组切割为较大的片段,大大降低了拼接难度,更重要的是大大减少了过去无法定位的漏洞,“这将照亮过去从未看到的基因组的黑暗角落。” 本研究的资深作者, 遗传学和生物医学数据科学心血管医学教授 Euan Ashley 这样形容。
Ashley 认为,虽然短读序列的成本现在低于 1000 美元,但是当将 DNA 切割成太小的片段时,部分真正的基因组序列就无法获得。例如在整个基因组中,一系列重复的字母,如 GGCGGCGGC,可以伸展数百个碱基对。对于只有 100 个字母的短读长,几乎不可能知道这段重复序列到底有多长,但是有时,重复序列的长度可能是决定某人的疾病倾向的关键。此外,人类基因组的一些部分是冗余的,这意味着有 100 个碱基对区段可能适合的很多个位置。这使得在重新组装基因组时无法知道放置那些片段的确切位置。如果用更长的片段,这种情况发生的几率就不那么频繁。
鉴于这些问题,在短读测序中,约有 5%的基因组序列不能被一对一地映射。而超过约 50 个碱基的任何缺失或插入,都可能太长而无法检测。Ashley 说,对于未能诊断病因的病例,短读序列测序仅能在约三分之一的病例中帮助医生提供诊断。
但是 Ramon 的情况不是其中。
八年前用于分析 Ramon 基因的 NGS 技术因为短读长所限未能识别出一个导致 Carney 综合征的基因突变。在此次 Ramon 基因组的长读测序研究人员鉴定出一段约 2,200 个碱基对的缺失,并证实 Carney 综合征的诊断确实是正确的。
Carney 综合征起因于 PRKAR1A 基因的突变,其特征在于几种肿瘤类型的风险增加,特别是在心脏和激素产生腺体如卵巢,睾丸,肾上腺,垂体腺和甲状腺等。根据美国国立卫生研究院的数据,仅有不到 750 个有这类症状的人得到确诊。(可能有许多医生因为没听说过,即使碰到也想不到)
这种病最常见的症状是良性心脏肿瘤或粘液瘤。心脏手术需要去除心脏粘液瘤。到 Ramon18 岁的时候,已经进行过三次这样的手术。他如今正在考虑进行心脏移植手术,对于他的病情进行正确的诊断对于移植小组来说很重要。除了典型的移植筛查之外,Ashley 说,移植小组团队还需要确保患者没有其他健康问题可能因免疫抑制剂而加重,心脏移植患者必须使用免疫抑制剂来避免排斥捐赠的器官。
虽然新发现有助于他的医疗团队对 Carney 综合征进行确认诊断,但 Ramon 沮丧地发现他不得不面对这个无法逃避的病情。“我很伤心,” 他说。“我花了一段时间来接受这样一个事实,我得一辈子带着这个病,直到我死亡的那一天。”“坏日子是暂时的风暴,他们会过去的。”“我很高兴来到这里。”Ramon 最近进行了第四次手术,以消除心脏中的三个肿瘤。Joseph Woo 医学博士是心脏外科手术教授和主席,在斯坦福医院进行手术。Ashley 表示,“这样年轻的肩膀承受这样的负担,并且决定是否要做心脏移植,需要难以置信的勇气。”
临床的未来由于技术进步和效率的提高,长读测序的成本一直在急剧下降。Ashley 估计本研究使用的测序当前成本在每个基因组 $ 5,000 至 $ 6,000 之间。“能用 7000-8000bp 片段代替 100bp,这实在很令人兴奋,”Ashley 说。他和许多其他医生都认为,长片段测序技术是基因组学未来的重要部分。“如果我们能够将长片段测序的成本降到每个人都可以接受的程度,这技术将会非常有用,大放异彩。”
Ashley 是 Stanford Bio-X 公司,斯坦福心血管研究所和斯坦福儿童健康研究所的成员。他还是斯坦福继承性心血管疾病中心的创始董事,斯坦福临床基因组学联合主任,以及国立卫生研究院未确诊疾病网络的指导委员会共同主席。PacBio 支付了测序费用。斯坦福大学病理学系和斯坦福大学癌症研究所也支持这项工作。
(责任编辑:sgx)