基于TCGA数据库的甲状腺癌相关miRNA和基因表述谱的分析及临床相关性的
第一章 绪 论
1.1 甲状腺癌的病因学和诊治现状概述甲状腺癌在世界范围内是发病率增长最快的恶性肿瘤。1973-2002 年间,美国甲状腺癌的发病率增长了 2.4 倍,而且在过去十年内仍在上升[1]。发病率迅速增长的原因可部分归因于超声技术和细针穿刺活检技术(fine-needle aspirationbiopsy,FNAB)的普遍应用导致的小结节(<2cm)的诊断能力提高。另一个导致发病率增加的主要原因可解释为微小癌(≤1cm)的病理学报告增多,并且从良性病变中分离出来[2]。尸检研究结果也支持这一关观点,即在 10-30%的人群中能够偶然发现微小癌[2-4]。对甲状腺癌发病率增高这一现象的进一步研究发现,在 1983-2006 年间,尽管微小癌的发病率每年增加了 19.3%,1-2cm、2-5cm 和大于 5cm 的肿瘤的发病率也分别每年增加 12.3%, 10.3%和 12.0%,这说明对微小癌的诊断增加不足以构成甲状腺癌总体的发病率增加[5]。甲状腺癌可分为滤泡旁 C 细胞来源和甲状腺滤泡细胞来源。滤泡旁 C 细胞来源的为髓样癌(medullary thyroid carcinomas,MTC),约占甲状腺癌的 5-10%。滤泡细胞来源的甲状腺癌按照分化程度可分为分化型甲状腺癌(differentiatedthyroid carcinomas ,DTC ),低分化甲状腺癌(poorly differentiated thyroidcarcinomas)和未分化癌(anaplastic thyroid carcinomas,ATC)。分化型甲状腺癌(DTC)通常所指甲状腺乳头状癌(papillary thyroid carcinoma,PTC)和甲状腺滤泡癌(follicular thyroid carcinoma,FTC)。其中,PTC 占甲状腺癌的 80%以上,FTC 约占 10%。分化良好的 PTC 预后良好,5 年生存率高于 97%。甲状腺微小乳头状癌(以下简称微小癌)的预后更佳,15 年的无病生存率高于 99%[4, 6, 7]。分化型甲状腺癌的死亡率几乎保持十万分之 0.5[8]。PTC 的不良预后因素包括年龄大于 45 岁、男性、肿瘤直径大于 3cm、腺体外浸润、多灶性、淋巴结转移、远端转移以及BRAF 突变阳性。除此之外,微小癌的不良预后因素还包括少数民族人群、腺体表面生长、肿瘤周边纤维化等[9, 10]。
......
1.2 miRNA 在甲状腺癌中的研究进展微小 RNA(microRNA,miRNA)是 18-22 个核苷酸组成的单链非编码 RNA,在转录后水平调节基因的表述。miRNA 通过完全和不完全匹配的方式与靶基因mRNA的3UTR结合,调控mRNA的翻译和稳定性。目前已经发现的成熟稳重miRNA有 1300 种[51]。成熟稳重 miRNA 的形成经历多个生化过程。miRNA 编码基因在 RNA 聚合酶 II的作用下转录为初级转录体(pri-miRNA),又经 Drosha-DGCR8 复合体的剪切,形成 60-70 个核苷酸组成的 miRNA 前体(pre-miRNA)。miRNA 前体经核转录受体 exportin-5 进入胞浆,在核酸内切酶 Dicer 的作用下进行剪切,形成由 21-23个核苷酸组成的双链的成熟稳重 miRNA。成熟稳重 miRNA 经过链选择和分离过程,一条单链参与形成 RISC 复合体,另一条单链则被降解。RISC 复合体能特异性地识别 mRNA,并介导 mRNA 的剪切或抑制[52]。大量研究表明,miRNA 在肿瘤的发生和发展过程中起到重要的作用,在多种肿瘤中异常表述,如乳腺癌、结肠癌、肺癌和胰腺癌等[53-56]。miRNA 在多种细胞生化和代谢途径中扮演重要的角色,如增殖、分化、凋亡、细胞周期调控等。目前认为,miRNA 是最重要的转录后水平的基因调控因子,已经证实人类约有1/3 的基因受 miRNA 调控[57-59]。miRNA 在不同物种之间具有高度保守性,进一步说明 miRNA 在关键代谢途径中的重要作用。诸多研究证实,miRNA 参与人类恶性肿瘤的发生和发展过程。在不同的肿瘤与正常组织相比较时,显示出不同的 miRNA 异常表述特征。miRNA 与肿瘤发生发展相关,可能是由于 50%以上的 miRNA 的编码基因位于染色体的断裂点、基因缺失或基因扩增的高发区域,而这些基因异常通常与肿瘤相关[60]。特异的miRNA 的过表述可能抑制某些抑癌基因的表述;miRNA 的表述下调可能导致某些癌基因的过表述,这两种情况均能引起细胞增殖、分化、凋亡、侵袭等生物学行为,导致肿瘤的发生和进展。有研究显示,肿瘤与正常组织相比,大多数种类的 miRNA 的表述水平是下降的;低分化的肿瘤细胞系中,miRNA 整体表述水平下调更为明显。这进一步说明 miRNA 的表述水平与肿瘤的分化程度相关。
......
第二章 材料与方法
2.1 研究对象2.1.1 TCGA 数据库纳入 TCGA(The Cancer Genome Atlas)数据库内的 499 例甲状腺乳头状癌样本,58 例甲状腺癌旁对照组织样本。纳入的样本以编号区分,均有完整的miRNA 和基因的 Illumina HiSeq System 高通量测序结果,并配有相应的临床病理学信息。miRNA 和基因表述数据为 level 3 级别。官方授权 TCGA 数据库的分析结果可以用于公开发表。
......
2.2 研究方法2.2.1 基于TCGA数据库的甲状腺癌相关miRNA和基因表述谱的生物信息学分析2.2.1.1 TCGA 数据库简介癌症是目前人类所面临的最复杂的疾病。目前已知的癌症种类达 200 多种,每种癌症体现了不同的分子特征,需要个体化的治疗策略。癌症基因组发生显著的变化。基因的结构异常,包括点突变、拷贝数变异、基因表述谱改变、表观遗传学改变等,对于每种癌症来说都是与众不同的。人类对癌症的诊断、治疗和预防的要求进一步提高,这与更加深入了解癌症的基因改变是密切相关的。基因组测序和生物信息学领域的科技发展,为获得肿瘤基因组带来新的希望。2005 年,肿瘤基因组图谱计划(The Cancer Genome Atlas,TCGA)应运而生,其目的在于应用最新的基因组分析技术,特别是全基因组测序技术,深入认识癌症基因的变化,促进新的肿瘤治疗方案、诊断方法及预防策略的发现。TCGA 计划是全世界最大规模的基因工程,它的研究基础是人类基因组计划(Human Genome Project,HGP),但其规模相当于 100 个 HGP。HGP 关注于疾病的遗传特征(先天性),而 TCGA 关注于癌症基因的获得性改变(后天性)。在癌症医学研究领域,TCGA 试验项目在生物医学研究领域起到革命性的作用,将肿瘤生物学、基因组技术、生物储藏库和生物信息学领域的最新成果进行整合和协调发展。这项计划被认为是生物医学研究中的一大转折点,也是药物治疗的一大转折点;。2.2.1.2 miRNA 及基因表述数据的获取TCGA 访问主页为 http://cancergenome.nih.gov/。 进入甲状腺癌(THCA)页面,选定 clinical、miRNAseq 和 RNAseq,进入数据获取页面。miRNA 和 RNA表 达 数 据 均 为 level 3 级 别 , 在 miRNAseq 主 选 项 下 勾 选 后 缀为 .miRNA.quantification.txt 的 文 件 , 在 RNAseq 主 选 项 下 勾 选 后 缀为.rsem.genes.normalized_results.txt 的文件,同时勾选 METADATA 和 clinical 主选项下的所有文件,确定后获取下载地址。数据获取后,首先将 RNA 标准化数据文件按照 METADATA 文件中提供的信息进行重新命名,以便与 miRNA 数据文件和临床信息进行比对。经过比对,共有 499 例甲状腺乳头状癌样本和 58 例正常甲状腺组织,所含 miRNA 和 RNA表述数据及临床信息完整,纳入后续分析。
......
第三章 结 果......................................................... 193.1 TCGA 数据库差异表述的 miRNA 和基因的筛选和调控网络的构建.........193.1.1 甲状腺癌相关差异表述的 miRNA 和基因的筛选..............19第四章 讨 论..................................................... 574.1 差异表述的 miRNA 和基因的筛选及调控网络的构建............574.2 差异表述的 miRNA 和基因对甲状腺癌的诊断能力的研究....59第五章 结 论................................................... 63
第四章 讨 论
4.1 差异表述的 miRNA 和基因的筛选及调控网络的构建miRNA 作为甲状腺癌的重要调控因子,其在肿瘤中的生化反应、信号通路传导和生物学行为等方面的作用已经大量报道证实。然而,miRNA 不是孤立的调节因子,其发挥作用要通过与靶基因的结合来实现。另有报道显示,人类基因组中有 1/3 的基因受到 miRNA 表述的调控,而并不是所有基因都在肿瘤的发生发展过程中起到决定性的作用,因此,尽管某些 miRNA 在肿瘤中的表述有所差异,但不代表着对肿瘤发生和发展进程起到影响。本研究中,我们先筛选出在PTC 中差异表述的 miRNA 和基因,这些差异表述的 miRNA 和基因有可能参与到甲状腺癌进程中;随后,我们对差异表述的基因进行聚类分析,进一步筛选出参与經典的肿瘤信号通路调控的基因,这些基因不仅在 PTC 中明显差异表述(倍数>2 且 P<0.01),并且与甲状腺癌的发生发展密切相关;然后,通过对 miRNA靶基因预测和比对,得到参与甲状腺癌调控的 miRNA,并且得到 miRNA 与靶基因的调控网络。同时,我们也首次发现了一些新的肿瘤信号通路相关的差异表述的 miRNA 以及基因,如上调的 miR-424,下调的 miR-363、miR-195 和 miR-152;上调的 CCNE2,下调的 COL4A1、TRAF6 和 HSP90B1。这些新的发现将扩充甲状腺癌分子生物学的知识库,为今后的功能学研究和临床诊断、靶向治疗提供了方向。本研究所使用的研究对象是 TCGA 数据库的 PTC 样本正常的甲状腺组织样本,表述数据是经过标准化的第二代高通量测序结果。有研究报道,高通量测序技术的结果相比于高通量微阵列结果,定量的可信程度更高,灵敏度更强,可以作为基因表述丰度的定量方法。美国政府发起的癌症和肿瘤基因图谱(CancerGenomeAtlas,TCGA)计划,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症的基因组变异图谱绘制出来,并进行系统分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后可以勾画出整个新型预防癌症的策略;。
......
第五章 结 论
1、本研究获得了甲状腺癌相关 miRNA 及 mRNA 表述谱,发现了 38 个差异表述的 miRNA 和 2731 个差异表述的 mRNA。2、本研究绘制了由 16 个 miRNA 和 20 个靶基因共同组成的甲状腺癌关键miRNA-靶基因的调控网络。3、本研究发现了多个具有甲状腺癌诊断潜能的 miRNA 及 mRNA,其中miR-34a、CDN2B、CCND1 和 TGFA 在 ROC 曲线中的 AUC、敏感性、特异性均大于 90%,是具有突出诊断能力的分子标志物。4、miRNA-靶基因作为组合标志物能够提高对甲状腺癌的诊断能力;其中miR-34a/BCL-2 在 ROC 曲线中的 AUC、敏感性、特异性均大于 95%,是一种较理想的甲状腺癌诊断标志物。5、本研究发现了甲状腺癌侵袭特征相关的 5 个 miRNA 及 25 个 mRNA,具有预测甲状腺癌风险度的潜能;其中 miR-652、TRAF6、HSP90B1、BCL2L1、ITGA3、DAP2、GNG7、GNAI1、PRACB 等属首次发现。
......
参考文献(略)