三代测序在「癌症」研究中的应用 | 述评

癌症是一种主要由基因组异常引起的疾病。不断出现的新型测序技术,帮助研究人员研究癌症基因组,以了解癌细胞的分子状态并揭示其不稳定性,如驱动突变或基因表达异常。三代测序技术使我们能够识别包括复杂结构变异的癌症突变。现代测序技术正在迅速发展,使我们能够更轻松地识别每个癌症病例中的突变。许多研究机构,如国际癌症基因组联盟(the international cancer genome consortium,ICGC)[50]和癌症基因组图谱(the cancer genome atlas,TCGA)[51] ,对每种癌症亚型特有的基因组进行了测序、分析和报告。他们主要关注点突变,如SNV和小片段的插入缺失,因为二代测序技术通常用于点突变的检测,其他类型的基因组变异非常复杂。对于最长只有几百个碱基读长的二代测序而言,检测和精确识别各种大小的结构变异(Structural variant,SV)和重复区域中的突变是一项艰难的挑战。尽管已经开发了许多生物信息学工具和分析流程(如Pindel、DELLY2、Manta、SvABA),但检测准确度和精确度仍然有限。二代测序也缺乏每个等位基因的信息,这意味着我们错过了发生突变的等位基因。为了弥补二代测序的不足,长读长的三代测序技术应运而生。 近年来,许多三代测序技术得到了开发和应用。如单分子实时测序  (single molecule real time,SMRT)  是太平洋生物科学公司  (pacific biosciences,PacBio)开发的长读长测序方法之一,该方法基于连接在零模波导中的DNA聚合酶,检测荧光信号。使用SMRT测序,可以获得超过10 kb的长读长数据。在最近的一份报告中,大约50%的序列以≥10kb的长度进行测序,这些数据用于构建人类基因组中常见SV的综合数据库[52]。Nanopore  测序仪已由Oxford Nanopore Technologies公司商业化。蛋白质纳米孔排列在膜上,以检测DNA或RNA分子通过纳米孔时电流的变化,从而允许对分子进行直接测序。MinION是一种便携式三代测序平台,初始成本低,每次运行可获得>5Gb的数据。文库制备也很容易进行,每次测序只需约48小时。此外,更大的平台GridIon和PromethION可以实现约10倍于MinION的数据输出。Jain等[53]报道了一种用于生成超长读长(高达>800kb)以对人类基因组进行测序和组装的流程,目的是检测包括重复序列和复杂结构变化的区域。这些长读长序列可用于探测短读长测序仪无法检测的基因组区域,突出了三代测序的优势。三代测序现在变得越来越普遍,因此,使用三代测序的癌症研究迅速增加并不断取得进展,以破译复杂的癌症基因组。在这里,我们介绍了近期三代测序的癌症研究以及三代测序带来的癌症基因组学的新发现。(作者:卓钟灵   戴二黑 赵晓涛)01 三代测序在癌症基因组中的研究三代测序的优势在于其适用于阐明等位基因突变状态和复杂癌症基因组的完整结构。虽然PacBio和Oxford Nanopore等具有代表性的长读长平台产生的序列碱基质量值低于Illumina等短读长测序平台,但在对大的基因组变异如CNV和SV进行基因分型时可以忽略这一缺点。这种方法已经用于各种疾病的治疗,包括多种癌症。此外,通过单独应用三代测序或与更准确的二代测序相结合,可以对单碱基水平分辨率变异  (如SNV和小片段插入缺失)  进行基因分型,如使用MinION测序来检测癌症相关基因  (如EGFR、KRAS、NRAS和NF1)  中的SNV和小片段插入缺失  [54]  。 三代测序的优势之一是以单等位基因分辨率鉴定基因组突变,如H1975肺腺癌细胞系中的EGFR原发性和继发性突变(分别为L858R和T790M)可通过三代测序进行分型[54-55]。在MinION序列中,研究者发现L858R和T790M突变都位于同一个等位基因中(72%的转录序列),另一个等位基因是野生型(22%的序列;其余6%的序列包括测序错误或次要等位基因部分)[54]  。三代测序可能正在成为基因分型的新标准,为抗癌药物的使用提供证据,并为每个人量身定制正确的治疗方案。此外,分型对于理解非编码突变的功能至关重要。在癌细胞中,启动子和增强子中存在许多突变,其中部分突变会导致异常转录,从而影响基因表达的水平。在癌细胞系中,仅TERT突变基因表达,这表明启动子突变产生了一个转录因子的结合位点并激活了突变等位基因中的转录和表达[56] 。使用二代测序数据无法实现启动子与下游外显子区域在等位基因水平的直接关联,因为这些基因座相距数百个碱基,无法由单个或少量短读长序列覆盖。在之前的一项研究中发现,在RERF-LC-Ad1中可以观察到NFATC1基因的调节突变,并通过三代测序对等位基因进行检测,发现这种SNV创建了ETS转录因子的从头结合位点,从而影响NFATC1等位基因特异性激活表达[55]。三代测序也用于检测SV。SV为>1kb的大型基因组变异,如大片段的插入缺失、倒位和重复,或染色体重排,如易位。为了检测这些变异,首先将长读长序列映射到人类参考基因组,然后利用唯一序列(由可以唯一映射到基因组不同区域的部分组成的序列),分析基因组区域,从而鉴定SV的断点。二代测序也可以使用这种分析方法,但大而复杂的SV和重复区域的鉴定对短读长来说是极为困难的。Norris等[57]尝试使用MinION检测SV,并成功鉴定了CDKN2A和SMAD4肿瘤抑制基因中与癌症相关的SV。Nattestad等[58]利用三代测序和二代测序检测乳腺癌细胞系基因组中的SV。有趣的是,他们发现ERBB2扩增出现在8号染色体的复杂重排中,只能通过三代测序来精确识别。此外,在最近的研究中,研究者使用PromethION对肺癌细胞系和临床样本进行了全基因组三代测序。平均每个样本获得47Gb数据[59]。我们能够通过肿瘤抑制基因中的局部重复、倒位和(或)缺失的组合检测到极其复杂的SV。这些含有SV的基因的功能在转录和蛋白质水平上失去了功能。还可以用相同的方式在临床样本中检测这些复杂的SV。尽管这些复杂的SV也可以通过使用各种生物信息学工具(如GenomonSV[60])从二代测序数据中识别出来,这些工具旨在检测分成两个不同基因座的序列,但使用该方法的误报率相对较高,并且它们的结构无法完全阐明,使得对此类结果的评估变得复杂。三代测序使我们能够阐明使用传统的二代测序尚未鉴定的异常基因组状态。但作为检测低频突变的关键步骤,DNA文库的扩增成为一项更加艰巨的任务,因为PCR和杂交将片段的大小限制在只有几个kb。为了解决这个问题,开发了Cas9辅助靶向染色体片段(CATCH),这是一种基于CRISPR-Cas9系统分离大基因组片段的方法[61]。Gabrieli等[62]使用CATCH从PBMC获得,并由MinION测序获得了一个长达200 kb的大片段,包含了乳腺癌和卵巢癌相关基因之一BRCA1的80kb区域,并成功地以约70倍的覆盖率对BRCA1区域进行了分析。02 三代测序在癌细胞的全长转录组检测中的研究转录组分析也受益于三代测序技术的应用。长读长测序能够完全覆盖全长转录本,因此,转录本亚型的结构可以通过全长互补cDNA测序来确定。特别是可通过三代测序检测到的融合转录本是几种癌症(例如肺腺癌)致癌的主要驱动因素。此外,具有异常结构的转录本极有可能产生免疫细胞可识别的肿瘤特异性新抗原,因此,它们是选择免疫检查点抑制剂的理想标志物。研究人员 [63]还证实了融合衍生的新抗原刺激的T细胞反应,强调了对全长转录本进行测序和阐明其完整结构的重要性。PacBio测序仪可用于全长cDNA测序(isoform sequencing ,ISO-seq),以检测剪切异构体和融合转录本。SK-BR-3是作为乳腺癌模型研究最多的癌细胞系,使用PacBio SMRT对其进行全基因组和转录组测序,以鉴定融合转录本和基因组变异,包括CNV和SV[58]。Nanopore测序仪也可以实现全长转录组的检测。Oikonomopoulos等[64]使用 MinION对全长cDNA进行测序,并且表达丰度对比其他平台 (Illumina和PacBio)具有高度相关性。研究者最近使用MinION对肺癌细胞系的全长转录本进行了测序,融合转录本包括CCDC6-RET等。检测到LC2/ad细胞系的驱动突变,并且可以对多种杂合突变,包括与分子靶向药物敏感性相关的SNV(如EGFR突变)进行测序和分型[65]。03 三代测序中在癌症表观基因组学中的研究DNA修饰通过转录调控在各种生物事件中发挥重要作用。在癌细胞中,我们经常观察到全基因组低甲基化导致染色体不稳定[66]。此外,高甲基化特异性发生在肿瘤抑制基因启动子的CpG岛中,导致细胞周期调节和错配修复等相关基因沉默[67-68]。亚硫酸氢盐测序是通过将未甲基化的胞嘧啶转化为尿嘧啶以区分甲基化和未甲基化胞嘧啶来分析DNA甲基化状态。因经亚硫酸氢盐处理的DNA会受损和碎片化,因此不适合长读长分析。为了解决这个问题,Yang等[69]在2015年,报道了使用PacBio测序仪开发长读长亚硫酸氢盐方案并在单个连续分子中对血液学恶性细胞系进行甲基化检测。Nanopore测序仪可以直接检测DNA甲基化。甲基化和未甲基化DNA之间的离子电流可以使用几种计算方法来区分,如Tombo、nanopolish[70] 和ignalAlign[71]。此外,目前的Nanopore碱基调用器Flappie能够在触发碱基调用期间识别CpG位点中的5mC甲基化,使我们能够在基因组测序的同时通过碱基轻松分析表观基因组。MinION作为直接测序平台,能够检测RNA中的碱基修饰,如N6-甲基腺嘌呤(N6-adenine,m6A)。几项研究结果显示,m6A修饰与几种癌症的发生和发展有关,如髓性白血病[72]和肺癌[73],这表明需要对m6A修饰进行深入分析,以识别癌细胞中的未知特征和新的治疗靶点。此外,目前正在单细胞水平应用全长cDNA测序,从而为单个细胞层面上的转录组提供等位基因和同种型水平信息[74]。04 三代测序在癌症基因组学中的挑战相比通过二代测序进行癌症基因组测序,三代测序可以收集更全面的癌症基因组信息,包括复杂的基因组变异、转录亚型、表观基因组碱基修饰等,但三代测序技术仍然存在一些阻碍其在临床测序中应用的障碍。首先,在三代测序平台上,目前碱基准确度约为90%,这是不够的,并且会使点突变的精确检测复杂化。其次,并非总是能够从临床样本中获得足够大且完整的高分子量DNA和全长RNA。手术标本和活检通常保存为福尔马林固定的石蜡包埋组织,用于组织病理学染色和长期储存。来自FFPE的样本通常DNA/RNA高度碎片化且结构受损。此外,三代测序技术仍然缺乏针对少量样品的高产量文库制备和测序规范流程。虽然可以使用全基因组或转录组扩增方法来增加DNA/RNA的数量,但首选仍是对原始分子进行直接测序,以避免扩增引起的样本片段大小限制,并检测分子中的所有碱基修饰。开发可以充分利用三代测序的分析方法已成为目前生物信息学中最重要的问题之一。我们现在有各种工具用于碱基识别、基因组组装、碱基抛光、映射,特别是对于检测突变,需要精确检测包括SV在内的各种类型的基因组变异。有许多现有的工具可以鉴定SV,但仍需开发工具来纠正三代测序中较高的碱基错误率。【参考文献】51.Cancer GA,Research N,et al. The cancer genome atlas pan-cancer analysis project. Nat Genet,2013,45:1113-1120.doi:10.1038/ng.2764 (2013).52.Audano PA,et al. Characterizing the major structural variant alleles of the human genome. Cell,2019,176:663-675e619. doi:10.1016/j.cell.2018.12.019 (2019).53.Jain M,et al. Nanopore sequencing and assembly of a human genome with ultra-long reads. Nat Biotechnol,2018, 36:338-345.doi:10.1038/nbt.4060 (2018).54.Suzuki A,et al. Sequencing and phasing cancer mutations in lung cancers using a long-read portable sequencer. DNA Res,2017,24:585-596.doi:10.1093/dnares/dsx027 (2017).55.Sereewattanawoot S,et al.Identification of potential regulatory mutations using multi-omics analysis and haplotyping of lung adenocarcinoma cell lines. Sci Rep,2018, 8:4926.doi:10.1038/s41598-018-23342-1 (2018).56.Huang FW,et al. TERT promoter mutations and monoallelic activation of TERT in cancer. Oncogenesis, 2015,4:e176.doi:10.1038/oncsis.2015.39 (2015).57.Norris AL, Workman RE, Fan Y,et al. Nanopore sequencing detects structural variants in cancer. Cancer Biol Ther,2016, 17:246-253.doi:10.1080/15384047.2016.1139236 (2016).58.Nattestad M,et al. Complex rearrangements and oncogene amplifications revealed by long-read DNA and RNA sequencing of a breast cancer cell line. Genome Res,2018, 28:1126-1135.doi:10.1101/gr.231100.117 (2018).59.Li H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics,2018, 34:3094-3100.doi:10.1093/bioinformatics/bty191 (2018).60.Kataoka K,et al. Aberrant PD-L1 expression through 3′-UTR disruption in multiple cancers. Nature,2016,534:402-406.doi:10.1038/nature18294 (2016).61.Jiang W,et al. Cas9-assisted targeting of cHromosome segments CATCH enables one-step targeted cloning of large gene clusters. Nat Commun,2015,6:8101.doi:10.1038/ncomms9101 (2015).62.Gabrieli T,et al. Selective nanopore sequencing of human BRCA1 by Cas9-assisted targeting of chromosome segments (CATCH). Nucleic Acids Res,2018, 46:e87.doi:10.1093/nar/gky411 (2018).63.Yang W,et al. Immunogenic neoantigens derived from gene fusions stimulate T cell responses. Nat Med,2019, 25:767-775.doi:10.1038/s41591-019-0434-2 (2019).64.Oikonomopoulos S, Wang YC, Djambazian H,et al. Benchmarking of the oxford nanopore minION sequencing for quantitative and qualitative assessment of cDNA populations. Sci Rep,2016, 6:31602.doi:10.1038/srep31602 (2016).65.Seki M,et al. Evaluation and application of RNA-Seq by MinION. DNA Res ,2019,26:55-65.doi:10.1093/dnares/dsy038 (2019).66.Rodriguez J,et al. Chromosomal instability correlates with genome-wide DNA demethylation in human primary colorectal cancers. Cancer Res,2006, 66:8462-9468.doi:10.1158/0008-5472.CAN-06-0293 (2006).67.Esteller M.Epigenetic gene silencing in cancer: the DNA hypermethylome. Hum Mol Genet,2007, 16: Spec No 1, R50-59. doi:10.1093/hmg/ddm018 (2007).68.Herman JG,Baylin SB. Gene silencing in cancer in association with promoter hypermethylation. N Engl J Med,2003,349:2042-2054. doi:10.1056/NEJMra023075 (2003).69.Yang Y, et al. Quantitative and multiplexed DNA methylation analysis using long-read single-molecule real-time bisulfite sequencing (SMRT-BS). BMC Genomics,2015, 16:350.doi:10.1186/s12864-015-1572-7 (2015).70.Simpson JT,et al. Detecting DNA cytosine methylation using nanopore sequencing. Nat Methods, 14:407-410. doi:10.1038/nmeth.4184 (2017).71.Rand AC,et al. Mapping DNA methylation with high-throughput nanopore sequencing. Nat Methods, 14:411-413.doi:10.1038/nmeth.4189 (2017).72.Barbieri I,et al. Promoter-bound METTL3 maintains myeloid leukaemia by m(6)A-dependent translation control. Nature,552:126-131. doi:10.1038/nature24678 (2017).73.Lin S, Choe J, Du P, et al. The m(6)a methyltransferase METTL3 promotes translation in human cancer cells. Mol Cell,2016,62:335-345. doi:10.1016/j.molcel.2016.03.021 (2016).74.Volden R,et al. Improving nanopore read accuracy with the R2C2 method enables the sequencing of highly multiplexed full-length single-cell cDNA. Proceedings of the National Academy of Sciences of the United States of America,2018, 115: 9726-9731.doi:10.1073/pnas.1806447115 (2018).  -End-   编辑 | 骆秉涵 王迪  原文以《二代测序和三代测序在癌症诊疗中的应用与研究方向》为题发表在《临床实验室》杂志2022年5月刊专题“分子诊断”实述评版块
(责任编辑:dawenwu)

常见问题
  • 如何在体龙基因完成所需的检测项目 流程简述 :在线咨询 - 采样送检 - 付款检测 - 检测分析 - 报告结果
查看详情

相关内容

官方客服团队

为您解决烦忧 - 24小时在线 专业服务