编辑: 牛牛小龙人 | 2013-02-02 |
3 位,其发 病原因通常与特定风险因素相关,包括乙肝或 丙肝感染,高酒精摄入量,或肥胖引起的脂肪 肝等[1] ,且在肿瘤发生发展过程中,与其相关的 关键基因在癌症不同阶段中表达具有差异性. 由此看出肝癌发生发展不仅受到差异基因作 用,还受到多种因素造成的基因改变积累及基 因相互作用影响,是一种多基因复杂疾病.因此,在研究肝癌相关基因的基础上,进一步研 究其基因间相互作用关系十分必要.生物学研 究也表明,基因及其产物并非单独起作用,而 是参与在复杂的、相互联系的通路、网络和分 子系统中,它们之间相互作用、相互影响[2] .在 肝癌研究中,肝癌基因调控网络 (HCC gene regulatory network,HCC GRN) 形象地描述了 肝癌基因间相互关系,可以帮助寻找与肝癌密 切相关的关键基因,为了解肝癌致病机理提供 新线索[3] .
1 HCC GRN 数据来源 构建肝癌基因调控网络的数据主要为:染 色质免疫沉淀 (Chromatin immunoprecipitation assay,ChIP) 实验数据,基因表达谱,二代测 序数据.如今二代测序技术蓬勃发展,基因组 及转录组数据随之剧增,为研究肝癌基因调控 网络提供了更多信息.因此研究者们都倾向使 用二代测序数据构建及研究肝癌基因调控网 络[4] .同时,相应的数据库也很多,常见的数据 库有:TCGA (The Cancer Genome Atlas),ICGC (International Cancer Genome Consortium),GEO (Gene Expression Omnibus).癌症基因组图谱数 据库 TCGA 是由国家癌症研究所和国家人类基 因组研究所及美国国立卫生研究院等共同完 成,旨在为研究者们提供一个数据下载、分析 的平台. 国际癌症基因组协会数据库 ICGC 收录 了50 种不同癌症类型或亚型的基因组、转录组 等信息,提供给研究者们查询癌症相关信息的 平台.基因表达集数据库 GEO 是一个公开的功 能基因组数据库,供研究者查询及下载芯片数 据等信息.这些数据库收集了肝癌相关的多种 类型数据信息,如基因甲基化、mRNA 表达谱、 microRNA (miRNA) 表达谱、拷贝数变异、突 变等大规模数据.本文将以上
3 种常见数据库 收录的肝癌相关数据信息进行汇总 (表1),为 研究者们提供参考. ISSN 1000-3061 CN 11-1998/Q Chin J Biotech October 25,
2016 Vol.32 No.10 http://journals.im.ac.cn/cjbcn
1324 2 HCC GRN 分类与特征比较 肝癌基因调控网络基于不同数据类型构 建,使最终得到的网络类型也不同.肝癌基因 网络中,一般以共表达基因 (Co-expression gene)、转录因子 (Transcription factor,TF)、 miRNA、基因 (Gene) 或这些调控子的集合作 为网络节点;
基因间相互作用的关系则作为网 络的边,从而构成基因网络[5] .根据网络中调控 子间相互作用的关系[6-10] , 可以将肝癌调控网络 分为
3 类:miRNA-gene 调控网络、TF-gene 调 控网络、TF-miRNA 调控网络.此外,由共表达 基因构成的共表达网络,对肝癌基因网络研究 也具有十分重要的意义[11] .因此本文将肝癌常 见的
3 种调控网络及共表达网络汇总 (表2), 并根据其不同的网络特征分类综述. 2.1 Co-expression 基因网络特征 Co-expression gene 网络即基因共表达网 络.共表达基因具有相似生物功能,其产物也 具有相似功能,但在亚细胞定位中,它们并不 存在相同位置上[12] .在共表达调控网络中,每 个节点代表一个基因,若两节点上的基因在适 当地选择组织样本上有显著的共表达现象,则 这两个节点相连[11] .通过分析基因共表达网络 中具有相似功能的基因,可以寻找未知基因的 功能,为发现新基因提供线索.因此基因共表 达网络也越来越多地运用于系统生物水平上基 因功能的研究. 表1各数据库收录肝癌相关数据信息 Table