Nat Micro | 单细胞层面的成像测量与建模揭示基因转录调控中的隐变量

1,039

在单细胞技术被广泛应用于生物研究的今天,基因表达的异质性(heterogeneity)早已不是一个新鲜事。即便两个细胞的基因型相同,它们的基因表达量可能是不一样的。换句话说,基因的表达量含有噪音成分,通常用基因表达量的方差或者方差与均值的比值来量化。基因表达的噪音在很多物种很多层面(例如转录层面或者翻译层面)都得到了广泛的研究。通常关于基因表达噪音的研究都是在一批基因型相同的细胞上开展的。尽管这些细胞基因型相同,这些细胞之间还是会有区别,比如细胞的大小,所处的细胞分裂周期的阶段,基因的拷贝数,还有很多我们尚未知道的区别。这些区别有没有可能会影响到基因的表达?基因表达的噪音到底来源于单个拷贝基因表达所含有的噪音还是来源于前面列举的这些细胞细胞之间的区别?把所有观察到的基因表达异质性全部归结为噪音是一个很危险的想法,这是不是在给我们的 “无知” (无法知道所有影响基因表达的变量,或者称为隐变量) 或者“无能”(测量的不准确性)找借口?试想如果我们可以精确地测量那些影响基因表达的所有变量,还会有这样的噪音么?或者说还会剩下多少噪音?2019年9月16日,伊利诺伊大学香槟分校的Ido Golding团队(共同一作为王梦宇和张静博士)在Nature Microbiology上发表题为Measuring transcription at a single gene copy reveals hidden drivers of bacterial individuality,利用单细胞成像测量与建模在大肠杆菌(Escherichia coli)中揭示基因转录调控中存在的隐变量。本篇工作采用了大肠杆菌中的乳糖操纵子(lactose promoter)为实验系统,寻找隐变量的第一步,便是将基因转录的测量从单个细胞的层面提高到单个基因拷贝的层面。以往原核生物中基因转录水平的测量通常都是测量单个细胞内特定基因所转录的mRNA的数目,这其中含有了正在被转录的mRNA(新生mRNA),和已经被转录完成的mRNA(成熟mRNA)。需要注意的是,由于原核细胞没有细胞核,所以区分新生mRNA并不像在真核细胞里那么直接。本篇工作采用了荧光抑制子操纵子系统 (Fluorescence repressor operator system)去标记基因的位置,联合单分子荧光原位杂交技术(Single-molecule fluorescence in situ hybridization)去标记mRNA,在显微镜下处于基因信号周围mRNA的就是新生mRNA,没有处于基因信号周围的就是成熟mRNA。本篇工作的作者建立了相关的数学模型,成功地预测了在实验中测量到的单个细胞中新生和成熟mRNA的数目。通过以上所述方法就能在每个细胞中区分初生mRNA和成熟mRNA以及每个基因拷贝的状态(有没有在转录)。在细菌的正常细胞周期里,全套基因都会复制一遍。因此所有基因在细胞周期的一段时间内都会有多于一个拷贝。通常人们认为不同基因拷贝的状态(有没有在转录)是相互独立的。定量的描述就是,在含有两个基因拷贝的细胞中,在转录状态的基因拷贝数符合二项分布(如果单个拷贝处于转录状态的概率为p,两个拷贝都在转录的概率即为p2,两个拷贝都不在转录的概率为 (1-p)2,两个拷贝一个在转录一个不在转录的概率则为2p(1-p))。在某些生长条件下,这确实是实验所观察的结果(不同lac 拷贝之间独立)。但是换到另一些生长条件下,实验却观察到不同lac拷贝之间的相关性(两个lac拷贝倾向于同时处于转录状态或者同时处于不转录状态)。这多个基因拷贝状态之间存在的关联性就是之前被忽略的一个会直接影响到基因表达异质性的隐变量。另一个隐变量就是基因复制和转录之间存在的相关性。实验观察到lac操纵子在被抑制的条件下,转录是 “一波一波” 伴随着基因复制的。且这种现象随着诱导物(inducer)浓度的提高变得越来越微弱,最后直接趋于这样一个情形:每当基因复制之后,新生mRNA的数目变成原来的两倍(因为基因拷贝数变成了之前的两倍)。人们很多年前就猜测基因复制和基因转录之间可能存在的联系,并且研究了一些基因复制的突变菌株,但因为当时对转录的测量敏感度比较低且突变菌株有着各种各样的问题,这么多年并没有令人信服的结果。本篇工作运用单细胞成像加上数学建模的方法在野生型大肠杆菌中观察到了基因复制和转录之间的相关性。这种基因复制与转录之间的相关性可能是那些表达量较低的基因保证转录发生的频率和时机的一种调控手段。这项工作发现了之前被忽视的影响基因表达的隐变量(不同基因拷贝状态的关联性,和基因复制对基因表达的影响),暗示简单把观察到的异质性全部归结为基因表达的噪音是一个危险的想法。在如今的定量生物学里,很多现象并不是像传统生物学的研究结果那样“肉眼可见“,而是需要精确的测量和对数据反复仔细的分析,并结合建立的数学模型,才可能得到有启发性的结论。借用定量生物学领域内研究人员常说的一句话,“Don’t trust data without a model fit next to it, don’t trust a model without data on top of it”.原文链接:https://doi.org/10.1038/s41564-019-0553-z
(责任编辑:tqh)

常见问题
  • 如何在体龙基因完成所需的检测项目 流程简述 :在线咨询 - 采样送检 - 付款检测 - 检测分析 - 报告结果
查看详情

相关内容

官方客服团队

为您解决烦忧 - 24小时在线 专业服务