大多数DNA并不编码蛋白。了解这种基因组“暗物质”如何和何时在基因调节的何处发挥作用是一个巨大的任务。如今,科学家们开发出的一种工具可能提供帮助。在一篇于2017年4月3日在线发表在Nature Biotechnology期刊上的论文中,来自美国杜克大学的研究人员描述了一种高通量筛选技术:利用CRISPR-Cas9表观基因组编辑鉴定人细胞基因组中的调节元件。这篇论文的标题为“CRISPR–Cas9 epigenome editing enables high-throughput screening for functional regulatory elements in the human genome”。论文通信作者为来自杜克大学的Gregory E Crawford、Timothy E Reddy和Charles A Gersbach。
Gersbach说,“结果证实导致更常见的复杂疾病(如心血管疾病、糖尿病和神经系统疾病)的大多数基因变异实际上发生于基因之间的调节区域。令人兴奋的事情是有方法对非编码基因组的功能进行标注。”
美国纽约大学的Neville Sanjana(未参与这项研究)在写给《科学家》杂志的电子邮件中写道,“这种非编码基因组是巨大的,鉴定哪些区域在调节蛋白编码基因中发挥着重要作用是充满挑战性的。”他解释道,这项研究“利用CRISPR组合筛选技术有助我们了解非编码基因组中的功能性区域位于何处。”
Gersbach和同事们构建出靶向两个感兴趣的基因位点β-globin和HER2周围的几百万个碱基中的潜在调节元件的向导RNA(gRNA)文库。他们随后产生整合着荧光蛋白的细胞系,其中这种荧光蛋白指示靶基因激活。
这些研究人员将核酸酶活性已被灭活的两种Cas9蛋白版本(被称作dCas9)— dCas9抑制版本(dCas9KRAB)和dCas9激活版本(dCas9p300)—中的一种导入到他们产生的细胞系中。dCas9KRAB招募让组蛋白H3K9发生甲基化的蛋白,从而导致异染色质形成和靶序列上的基因抑制。dCas9p300结合到靶DNA增强子或启动子上,促进组蛋白H3K27发生乙酰化,从而导致基因激活。
接下来,这些研究人员将较低水平的gRNA文库导入到他们产生的细胞系中以便确保单个gRNA存在于每个细胞中。他们随后基于荧光分选这些细胞,并且对存在于发生特别高水平和低水平靶基因表达的细胞中的gRNA进行测序。
序列鉴定印证了已知的调节元件,并且揭示出其他的DNA序列的新作用。很多这些序列(尽管不是所有序列)出现在dCas9KRAB筛选和dCas9p300筛选中。一些序列似乎对一种细胞类型中的基因发挥着调节作用,但是对另一种细胞类型中的相同基因并不会起着调节作用。尽管这些观察到的基因表达变化是微妙的,但是这些研究人员证实了单个DNA序列的调节作用。
Reddy告诉《科学家》杂志,“我们知道这种表观基因组的几个方面与基因调节变化存在着极强的关联性,而且我们总是努力将这些观察结果转化为对基因实际上是如何受到调节的真正理解。”
Reddy说,“我们在此之前并不知道我们观察到的这种特定的表观遗传修饰是否存在一种因果关系。但是,我们如今确实从这项研究和来自我们的实验室和其他人的其他研究了解到对这种表观基因组进行修饰确实在调节一些靶基因中发挥着作用。”
Reddy、Gersbach和他们的同事们正在扩大这种筛选技术以便研究不同细胞类型和不同组织类型中整个基因组的潜在调节元件。他们也计划利用这种技术更好地理解基因调节异常导致的疾病。
(责任编辑:zqg)