不要总想着挖掘表达芯片数据

RNA-seq这样的测序数据也可以的啊!

比如这篇Published: 12 March 2019的文章:Identification of Key Long Non-Coding RNAs in the Pathology of Alzheimer’s Disease and their Functions Based on Genome-Wide Associations Study, Microarray, and RNA-seq Data  就采取了挖掘RNA-seq这样的测序数据的策略。

image-20191128151051834

这样得到的差异分析结果,再去表达芯片里面去验证;

image-20191128151237541

这样的两个组的样本进行差异分析,然后走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R

  • 第二讲:从GEO下载数据得到表达量矩阵

  • 第三讲:对表达量矩阵用GSEA软件做分析

  • 第四讲:根据分组信息做差异分析

  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析

  • 第六讲:指定基因分组boxplot指定基因list画热图

  • 第七讲:根据差异基因list获取string数据库的PPI网络数据

  • 第八讲:PPI网络数据用R或者cytoscape画网络图

  • 第九讲:网络图的子网络获取

  • 第十讲:hug genes如何找

比如拿某一组的样本与剩余其它组所有样本进行比较,这样的差异分析策略还是蛮流行的!我前面在生信技能树也写过教程:如果你的分组比较多,差异分析策略有哪些?

最近看到一篇文献 Nucleic Acids Res. 2013 Nov;,题目是Identifying subgroup markers in heterogeneous populations 也提到了这个情况;

Instead, a subgroup of samples in one group shows differential behavior with respect to all other samples.

所以他们提出来了 Detection of Imbalanced Differential Signal (DIDS) 算法:

细读表达芯片的公共数据库挖掘系列推文 ;

(0)

相关推荐

  • 生信神器之一站式表达谱数据分析

    表达谱数据分析的时候,经常包括各种各样的分析.比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等.NetwordAnalyst(https://www.networkanalyst.ca/ ...

  • 基于单细胞测序的转录因子调控网络预测数据库

    基因转录的过程当中,基因由DNA转录成mRNA的过程受到很多因素的调控.其中就包括了转录因子的调控.转录因子调控的一个主要的过程是转录因子和基因启动子区进行结合进而来对其表达进行调控.由于每个转录因子 ...

  • 肿瘤miRNA靶点预测数据库

    miRNA作为ncRNA的一类.其主要发挥功能的主要方式是通过和基因形成双向互补链进而来影响基因的表达.因此通过miRNA和基因序列是否互补就可以遇到miRNA可能的靶基因了.这个基本上就是经典的预测 ...

  • 高通量测序技术极简介绍

    我们在介绍公共数据库的时候,经常会提到RNA-seq.Chip-seq.甲基化芯片等,对于不了解高通量测序的同学而言,不是很清楚这些都具体是什么.这里就很简单,目的性极强的介绍一下. 测序技术分类 高 ...

  • 全脑基因表达和神经影像数据关联指南

    人类影像遗传学作为理解大脑神经表型的分子基础的重要方法,一般流程是通过候选基因研究,在全基因组水平研究一个或多个等位基因变异与一种或多种影像表型(IDP)变化的相关性.这项工作的假设普遍是与IDP相关 ...

  • YM500v2:用于人类癌症miRNA研究的小型RNA测序数据库

    YM500v2是用于个人smRNA-seq数据集的miRNA定量,是miR鉴定和新型miRNA预测的集成数据库.YM500v2中包含了YM500之后开发的与miRNA相关的新算法,更重要的是,纳入了8 ...

  • 基因总体预后没意义就真的没意义了嘛

    我们在研究基因对于某一个疾病预后是否有影响的时候.最直接的就是单纯的做这个基因对所有患者的预后分析.如果预后有意义,就说明这个基因影响疾病的预后.如果没有意义就说明这个基因不重要的嘛?当然也不是的.疾 ...

  • 怎么样查找正常组织的基因表达谱数据?

    大家可以收藏一下. 数据库介绍 RNA-Seq Atlas - 通过下一代测序在正常组织中进行基因表达谱分析的参考数据库 RNA-Seq Atlas是一个基于网络的RNA-Seq基因表达谱和查询工具库 ...

  • 批次效应去除工具

    我们在进行公共数据挖掘的时候,经常会碰到要对多个数据集联合分析的时候,如果想要把这些数据放到一起进行分析的话,那么首先还是需要先去除批次效应才能进行分析的.之前我们的介绍的数据库的时候,也提到了两个和 ...

  • 【视频讲解】- 小鼠表达芯片数据整合分析

    本讲涉及到的芯片分别是: GSE7762 GSE62346 GSE50382 视频里的示例会带领大家使用 GEOquery 包里面的getGEO函数下载每个表达芯片数据在GEO数据库里面的数据,解析获 ...

  • 一个甲基化芯片数据被挖掘好几次(学徒作业)

    前面我在<生信技能树>的教程:什么,你感兴趣的GEO数据集没有关联到原始文献出处,提到了一个GSE数据集是可以关联到很多文献,如果这个数据集被挖掘过.但是举例子的时候留空白了,居然被眼尖的 ...

  • 不要总想着和老天爷抢饭碗!

    读者互动 (天大地大老天爷最大,学中医的人要明白一个道理,老天爷说的都是对的.书也许会出错,人也许会出错,只有老天爷绝对不会有错.所以我们才需要观天之道,执天之行) 正文开始 有读者说经常看我的文章, ...

  • 做投资理财“心太急”,总想着赚大钱却亏钱了,该怎么办?

    现代社会发展很快,大家对于物质的追求也是与日俱增,在这样的环境下,人们的心态会变得越来越急躁,急着去赚钱买房,想要通过自己的努力获得加薪晋职的机会.当我们发现连地铁上都在宣传投资理财时,手机上不断出现 ...

  • 菜鸟记176-汇总多个不规则的数据表,原来还可以这样玩!

    关键词:EXCEL2016:SUMIF函数:提取数据:操作难度*** 温馨提示:结合以下文章阅读效果更佳 <菜鸟记32-关于求和的故事之下集> 您在工作中有没有遇到这样的设计? 为了节约纸 ...

  • 出汗,不要总想着止汗!

    出汗,不要总想着止汗! 临床上,有一部分人脾虚湿盛体质,多有自汗表现,医者治此,多对发散风药顾忌,恐致汗多气液两伤,绝大多数都是加敛汗之品以止汗.殊不知,越敛越出汗. 湿邪致病,适度出汗反有利湿出,是 ...

  • 与其总想着改变别人,不如先从改变自己开始

    与其总想着改变别人,不如先从改变自己开始

  • 漫画丨“青年人,不要总想着搞钱!”

    放开那个钱,让我来搞 "多"说两句 继"打工人"."干饭人"之后,"搞钱人"又火了 接着就有"过来人" ...

  • 一家游戏公司CEO给股东的信:做游戏不能总想着榨干玩家的每一分钱

          只有与玩家构建一种互相信任和欣赏的长期关系,才可能诞生一家伟大的游戏公司. 股东信是投资者了解上市公司的最佳渠道,理性的投资者应该仔细阅读每一封股东信.但由于中国资本市场并不成熟,因此能够 ...