近日,由中国科学院北京基因组研究所国家基因组科学数据中心(以下简称国家中心)开发的人类表观组关联分析数据库 EWAS Data Hub 正式上线。该项研究成果以 “EWAS Data Hub: a resource of DNA methylation array data and metadata” 为题在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表。近年来 , 表观组关联分析(Epigenome-wide Association Study,EWAS)已成为探索复杂性状表观遗传基础的有效策略。随着大量 EWAS 科研成果的发表,现已积累了海量表观遗传数据,尤其是 DNA 甲基化芯片数据,其海量数据的整合分析对系统研究不同实验条件下的 DNA 甲基化状态以及探索与各种性状相关的表观遗传机制具有重要意义。目前,国际上存在一些数据库来存储 DNA 甲基化芯片数据,但这些数据库缺乏有效和统一的归一化方法来消除不同数据集之间的批次效应,可能对下游分析产生负面影响,元数据标准不统一,并且都不提供跨不同组织、性别、种族和疾病的标准化的 DNA 甲基化图谱。为了解决这些问题,国家中心开发了 EWAS Data Hub 数据库。目前,EWAS Data Hub整合了来自 GEO、TCGA、ArrayExpress 和 ENCODE 数据库的共计 75,344 个样本的 DNA 甲基化芯片数据和对应的元数据,并采用了有效的归一化方法来消除不同数据集的批次效应。EWAS Data Hub利用海量高质量 DNA 甲基化数据和标准化元数据的优势,为 485,512 个探针和 36,397 个基因提供了一系列重要的评估值(包括组织特异性、年龄相关性、性别差异和种族特异性)和不同背景下的参考 DNA 甲基化图谱,涉及 81 种组织 / 细胞类型(包含 25 个脑部和 25 种血细胞类型),67种疾病(包括 39 种癌症),不同年龄、性别、种族和 BMI。同时,EWAS Data Hub 还提供了高效的查询方式。该研究得到了国家重点研发计划、中科院战略先导专项、中科院国际大科学计划和中科院十三五信息化专项等项目基金资助。特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
(责任编辑:xsq)
北京基因组所国家基因组科学数据中心开发表观组关联分析数据库
358