芯片加上测序再结合qPCR应该是很保险了吧
看到朋友圈有人转发了一个研究,是2020年8月4日, 著名肝脏学杂志Hepatology在线发表了哈尔滨医科大学附属第二医院崔云甫团队的 一项circRNA研究工作,报道胆管癌中ERBB2来源circRNA(文中命名为circ-CCAC1)在胆管癌中具有促癌作用。circ-CCAC1可以通过胞外囊泡进入内皮细胞并导致内皮细胞屏障的破损,进而促进肿瘤侵袭转移和血管生成。
文章是《A novel circular RNA, circ-CCAC1, contributes to CCA progression, induces angiogenesis, and disrupts vascular endothelial barriers》,文章链接是https://aasldpubs.onlinelibrary.wiley.com/doi/abs/10.1002/hep.31493, 其推文的详细介绍的链接是:https://mp.weixin.qq.com/s/tVqoBRZIKUAjPmOINpwHsg
我之所以注意到它,主要是他们做了芯片加上测序再结合qPCR,非常的保险。胞外囊泡的芯片分析共发现了85种差异circRNA分子,癌与癌旁组织的高通量测序分析发现了140种显著差异的circRNA分子。两种分析的结果中发现了3个circRNA变化趋势一致,最后又使用QPCR分析,如下所示:
全部的策略如下:
芯片法分析了5例胆管癌患者胞外囊泡样品和5例对照样品的circRNA。 与此同时,作者还将5例对应胆管癌患者的癌组织与癌旁组织进行了高通量RNA-seq测序分析。 进一步的QPCR分析表明,hsa_circRNA_102064的差异最显著。
最后涉及到了一点环装RNA的背景知识:hsa_circRNA_102064由ERBB2的23-26外显子形成。早期研究中曾将ERBB2基因外显子3-7形成的circRNA命名为circ-ERBB2,为有效区分,本文中将hsa_circRNA_102064命名为circ-CCAC1,其结构如下所示:
虽然这篇文章并没有上传他们的芯片数据和测序数据,但是其正文和附件,都是超级详细了,理论上我们应该是要相信他们课题组的科研成果!前面我们在生信技能树已经系统性的总结了circRNA的相关背景知识:
而且差异分析呢,可以看到我五年前的教程,推文在:
解读GEO数据存放规律及下载,一文就够 解读SRA数据库规律一文就够 从GEO数据库下载得到表达矩阵 一文就够 GSEA分析一文就够(单机版+R语言版) 根据分组信息做差异分析- 这个一文不够的 差异分析得到的结果注释一文就够
反正这些芯片技术都是十几年前的了,大家不要觉得我五年前的教程有什么过时的地方哈,只要能拿到文章的数据,马上就可以走一下我的代码,得到同样的图表哦!
多说一句
芯片这个东西本来就不是很靠谱,而且还被一些不良商家败坏了名声,所以本来就不建议大家去使用了。
直接测序即可,而且你做好了测序数据可以上传,这样大家的测序数据都可以互相使用,供全体科研界检验。
一个优秀的例子
2020年8月12日,EMBO Reports杂志在线发表了一项环状RNA的重要研究工作,报道EB病毒编码的环状RNA可以调控胃癌干细胞的“干性”。文章的通讯作者是中山大学附属第三医院的邵春奎主任**。文章是:《Epstein-Barr virus-derived circular RNA LMP2A induces stemness in EBV-associated gastric cancer》,链接是:https://pubmed.ncbi.nlm.nih.gov/32790025/
数据在:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE145894
GSM4338969 Xenograft PBS 1-circRNA seq
GSM4338970 Xenograft PBS 2-circRNA seq
GSM4338971 Xenograft PBS 3-circRNA seq
GSM4338972 Xenograft 5-Fu 1-circRNA seq
GSM4338973 Xenograft 5-Fu 2-circRNA seq
GSM4338974 Xenograft 5-Fu 3-circRNA seq
作者将富集 EBVaGC 干细胞第四代 5-Fu 处理和 PBS 处理的异体移植瘤组织进行环状 RNA 高通量测序,共鉴定出261个ebv-circRNA。与来源于人类基因组编码的环状RNA相似,大部分的ebv-circRNA 长度在300到600个核苷酸之间,主要来源于编码蛋白质的外显子。此外,同一个EBV基因可以产生多种由不同外显子或内含子构成环状RNA异构体。
可以看到,这个研究不仅仅是上传了表达矩阵在GEO数据库,而且呢上传了测序原始数据在SRA数据库,链接是:https://www.ncbi.nlm.nih.gov/sra?term=SRP250675 关于这两个数据库的介绍的推文在:
当然了,circRNA seq测序数据分析并不在我们的B站免费NGS数据处理视频课程就很多了,已经组建了微信交流群的有下面这些:
免费视频课程《RNA-seq数据分析》 免费视频课程《WES数据分析》 免费视频课程《ChIP-seq数据分析》 免费视频课程《ATAC-seq数据分析》 免费视频课程《TCGA数据库分析实战》 免费视频课程《甲基化芯片数据分析》 免费视频课程《影像组学教学》 免费视频课程《LncRNA-seq数据》 免费视频课程《GEO数据挖掘》 肿瘤基因测序
但其实如果你认真跟完了我的一些课程,就会明白,尽管说ngs技术层出不穷,但是绝大部分数据分析流程的共性很明显,背后都是基于R语言的统计可视化,以及基于Linux的NGS数据处理这样的基础知识:
把R的知识点路线图搞定,如下:
了解常量和变量概念 加减乘除等运算(计算器) 多种数据类型(数值,字符,逻辑,因子) 多种数据结构(向量,矩阵,数组,数据框,列表) 文件读取和写出 简单统计可视化 无限量函数学习
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:
第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘! 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。 第5阶段:任务提交及批处理,脚本编写解放你的双手。 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。