GalNAc-type O-糖基化又被称作黏蛋白型 (mucin-type)O-糖基化,是最为常见并且结构最为复杂多变的蛋白质翻译后修饰之一。常见的O-糖有四种不同的核心结构(core1 – core4),并且还能连接不同的单糖从而形成更加复杂多样的结构。蛋白质上的O-糖基化具有广泛的生物学功能,其中尤以core1及其相关类型的O-糖跟疾病最为相关。例如在多种肿瘤细胞中,core1 (T-antigen) 、单个GalNAc(Tn-antigen)以及他们的唾液酸化类型的高表达便是其常见特征。长久以来,虽然基于生物质谱的蛋白质组学以及糖蛋白质组学的研究取得了日新月异的进展,但是对于糖蛋白质组层面上的完整糖肽的鉴定以及定量依然存在极大的挑战。
2019年8月5日,Nature Methods在线发表了丹麦哥本哈根大学糖组学中心(Copenhagen Center for Glycomics, CCG)Sergey Y. Vakhrushev 团队(叶子璐博士为第一作者)的最新研究成果:Glyco-DIA: a method for quantitative O-glycoproteomics with in silico-boosted glycopeptide libraries 。通过首次在O-糖蛋白质组学中采用质谱技术中新型的数据非依赖型采集模式(Data-Independent Acquisition, DIA),极大地提高了不同样品中的对于糖蛋白质组的检测能力。
在基于DIA技术的数据分析中,高质量且全面的肽谱图库(peptide spectral library)是最为核心的前提条件之一。在本研究中,基于CCG所开发的SimpleCell 技术平台【1】,研究人员首先在包括多种不同SimpleCell 细胞系、普通细胞系以及人类血清中鉴定了2000多个糖蛋白中超过11000个完整糖肽序列,大幅扩充了人类O-糖蛋白质组,并且将这些鉴定到的完整糖肽转换成高质量的O-糖肽谱图库。由于凝集素富集的特性,这些O-糖肽的结构只限于Tn结构或者T结构。而研究人员通过质谱技术中高能诱导解离 (HCD) 的特性,通过in silico 的方式构建了与这些糖肽具有相同肽段序列而多种不同糖链结构的O-糖肽谱图库,并且理论上能应用到更多不同的糖链结构以及其他翻译后修饰。
构建好大规模的O-糖肽谱图库后,研究人员首先对比了DIA方法与传统的数据依赖型采集(Data-Dependent Acquisition, DDA)方法。通过分析经过梯度稀释的一系列富集过后的O-糖肽样品在DDA以及DIA中的表现,DIA方法得到了明显更多的鉴定数目,并且展现出了准确的非标记定量的能力。然后研究人员将此方法应用于了人类血清样品当中。通过对于仅仅相当于1微升的未经富集的血清样品的分析,研究人员鉴定到了将近100个糖蛋白。并且依托于此研究中开发O-糖肽谱图库,研究人员还能在同一个O-糖基化位点上鉴定以及相对定量到多种不同的糖链结构以及对应的非糖基化肽段。这项研究为糖生物学家们进一步研究糖基化的作用提供了有力的工具,并且有望被应用于将到来的临床(糖)蛋白质组学的研究与临床诊断当中。
丹麦哥本哈根大学糖组学中心叶子璐博士为本文的第一作者,现中山大学药学院毛洋教授也参与了本工作。
原文链接:
https://www.nature.com/articles/s41592-019-0504-x
(责任编辑:tqh)