Nature Methods 新方法能矫正 RNA-seq 测序的技术偏差

基因表达分析正越来越多地用于癌症的诊断和检测,是生物学研究的主要工具,一种新型的计算方法可以提高基因表达分析的准确性。

来自卡耐基梅隆大学和纽约州立大学石溪分校的研究人员称,他们的方法(被称作 Salmon)能够矫正转录组测序技术(RNA-seq)中的技术偏差。而且这种技术预估基因表达水平的速度也与其它快速方法相当。

他们的方法已发表于 3 月 6 日的 Nature Methods 杂志,并且 Salmon 的资源代码已经被成千上万的用户免费下载。

来自卡耐基梅隆大学计算生物学系的助理教授 Carl Kingsford 说,Salmon 为 RNA-seq 实验及其可能存在的偏差提供了更丰富的计算模型。为这种技术越来越多的应用于疾病和其压型的分类、了解发育过程中的基因表达变化、以及跟踪癌症的进程等提供了重要的保障。

尽管生物体基因的构成是静态的,但是个体基因的活动是随着时间的推移而变化的,这使得基因表达成为理解生物体工作方式,以及疾病过程中发生了什么,的重要指标。基因的活性虽然不能被直接测量,但可以通过监视 RNA 来进行推断。

RNA-seq 是目前捕捉基因活性的领先技术。但是,根据由于不同组织、不同制备方法、不同实验误差,导致 RNA-seq 的读数也会比实际偏高或偏低。

虽然我们知道会存在许多偏差,但是在对它们建模时还是会发生样品循序的偏差。为此,倘若你准备用传统的方法建立一个更复杂的偏差模型,那将是非常耗时的。

Salmon 结合了一个新的双相位并行推理算法、功能丰富的偏差模型,以及超快速读取映射程序。这是第一个能正确测量 GC 片段偏差的,全转录组水平测量技术,能大幅度提高丰度估值的准确性以及差异表达分析的灵敏度。

Salmon 算法得名于一种擅长逆流而上的鱼——鲑鱼。当实验数据 “流过” 时,该种算法可以直接估计出偏差的影响和基因表达水平。因此,它可以像其他快速分析工具一样,迅速而准确地得知基因表达水平。

(责任编辑:sgx)

常见问题
  • 如何在体龙基因完成所需的检测项目 流程简述 :在线咨询 - 采样送检 - 付款检测 - 检测分析 - 报告结果
查看详情

相关内容

官方客服团队

为您解决烦忧 - 24小时在线 专业服务