CRISPR-Cas9是一种基因编辑技术,能够让人们在基因组的任何位置切割DNA,从而产生突变和关闭特定基因。全世界的科学家都在使用这项重要技术来研究哪些基因对各种疾病(从癌症到罕见疾病)都很重要。如今,人们正在利用它开展治疗性林场试验,以便校正人类基因中的有害突变。
特异性的向导RNA(gRNA)与精确的靶DNA序列结合,从而将Cas9“剪刀”引导到合适的DNA位点上。然而,人们很难预测最终的突变将会是什么样子,这是因为当细胞修复DNA双链断裂将DNA的两个切割末端重新连接在一起时,这通常会导致进一步的变化发生。
为了研究这一点,在一项迄今为止最大规模的探究CRISPR作用机制的研究中,来自英国威康基金会桑格研究所的研究人员构建出4万多对不同的靶DNA和gRNA,并执行CRISPR-Cas9基因编辑。通过对不同细胞中的每对靶DNA和gRNA进行深度测序,他们能够详细地分析DNA是如何被切割和重新连接在一起的。他们发现这种DNA修复依赖于靶DNA和gRNA的精确序列,并且发现在相同的序列中,这是可重复的。相关研究结果于2018年11月27日在线发表在Nature Biotechnology期刊上,论文标题为“Predicting the mutations generated by repair of Cas9-induced double-strand breaks”。论文通讯作者为威康基金会桑格研究所的Leopold Parts博士。论文第一作者为威康基金会桑格研究所的Luca Crepaldi博士和Felicity Allen博士。
这些研究人员随后利用大量的序列数据开发出一种机器学习计算工具,该工具创建了确定DNA修复结果的一般规则。这种称为FORECasT的程序能够让他们仅使用靶DNA序列来预测修复后的DNA序列。
这项研究是迄今为止对CRISPR-Cas9作用机制进行了最大规模和最全面的研究,分析了一亿多个DNA序列,这就使得研究这个基因编辑过程成为可能。这些研究人员正是细胞以细胞的方式修复特定的靶序列,这就表明细胞的这种修复机制是可重复的。
在未来的CRISPR-Cas9应用中,这种机器学习计算工具将为科学家们节省时间和资源,而且它能够被全世界的科学家们免费使用。
参考资料:
Felicity Allen et al, Predicting the mutations generated by repair of Cas9-induced double-strand breaks, Nature Biotechnology (2018). DOI: 10.1038/nbt.4317.
(责任编辑:sgx)