“自古深情留不住,唯有套路得人心”。我们已经讲完了TCGA数据分析中2个分析套路: 生存分析套路 和 WGCNA分析套路。现在我们来讲讲第3个套路,ceRNA网络。
ceRNA(Competing endogenous RNA) 是真核生物体内存在的一种具有相同miRNA反应结合元件(microRNA response elements,MRE)的多个RNA分子竞争性的与miRNA结合,从而形成的一种相互调节机制。由于miRNA调控的RNA(可以是编码蛋白的mRNA,也可以是长链非编码RNA或者circRNA)非常的多,而一个RNA又受多个miRNA调控,这就使得ceRNA调控在细胞内非常的普遍。 今天给大家介绍一篇ceRNA研究套路的文章《comprehensive analysis of a long noncoding rna-associated competing endogenous rna network in colorectal cancer》。
研究思路详述:
1 从TCGA公开的数据中下载结直肠癌相关的数据,包括lncRNA, miRNA, 编码蛋白基因的表达数据以及对应病人的临床数据
2 分别就lncRNA, 基因, miRNA比较癌症和癌旁组织中的表达差异
3 分别对差异的miRNA靶向lncRNA, miRNA靶向基因进行预测
4 结合miRNA靶向lncRNA, 基因构建ceRNA调控网络
5 ceRNA网络中的基因, lncRNA 进行表达量的相关性分析
6 ceRNA网络中miRNA, 基因, lncRNA 进行生存分析
7 ceRNA 网络中的基因进行GO,KEGG功能富集分析
1 差异表达分析
首先比较一下癌症和癌旁组织中基因,lncRNA,miRNA的表达差异,筛选出那些显著的分子。
1.1 基因差异表达分析聚类图
1.2 lncRNA差异表达分析聚类图
1.3 miRNA差异表达分析聚类图
2 miRNA调控lncRNA,基因的预测
miRNA能够靶向基因从而抑制其翻译成蛋白,但是同时也能够靶向lncRNA,这就会导致lncRNA 和基因间存在一个竞争miRNA的关系,通过这种竞争关系,形成一种协同表达的相关性。
2.1 miRNA靶向基因的调控预测
2.2 miRNA靶向lncRNA的预测
2.3 ceRNA网络的构建
基于miRNA调控lncRNA和基因,构建ceRNA调控网络,可以了解各个分子之间的调控关系。
2.4 基因,lncRNA相关性分析
ceRNA网络中,受同miRNA调控的lncRNA和基因间存在一定的协同表达相关性。可以针对ceRNA网络中的基因,lncRNA进行表达相关性分析
2.5 生存分析
为了研究ceRNA网络中的miRNA, 基因, lncRNA是否对癌症的预后有重要的影响,可以分别进行生存分析。
2.6 功能富集分析
为了了解ceRNA网络中基因的功能,可以对基因进行GO,KEGG的功能注释和富集分析。
2.6.1 针对基因进行GO的功能注释和富集分析
2.6.2 针对ceRNA网络的基因进行KEGG代谢通路的注释和富集分析
以上就是TCGA数据的ceRNA分析套路,如果你也想学习如何分析TCGA数据,按照套路发表文章,请点击下面的“阅读原文”学习我们的TCGA系列课程。
延伸阅读