蛋白质组学习小组起飞啦!
还记得生信技能树的传送门系列吗?转录组、甲基化、ChIP-Seq、lncRNA、编程实战…
都非常成功,培养了非常多的技能树优秀小伙伴,形成了华语圈最大的生物信息学交流社群,以及B站的74小时生信工程师技术教学视频。
蛋白质组学习小组
上周的《蛋白质组学文献数据分析全流程复现二选一(组建学习小组)》中,大家投票选出了《
The Primary Effect on the Proteome of ARID1A-mutated Ovarian Clear Cell Carcinoma is Downregulation of the Mevalonate Pathway at the Post-transcriptional Level
》一文来学习蛋白质组数据分析流程。
今天正式发布学习小组通知啦!
报名须知
学习内容:根据文章复现蛋白质组数据分析流程
人数
报名方式:扫描二维码添加负责人微信,支付18.8元辛苦费拉你入群,仅限前100名。
学习时间:三个月
文献阅读
1. 认真阅读文章中的实验设计(实验设计很重要)
2. 找出分析样本的仪器、需要的数据分析软件与定量方法和所用的数据库
分析步骤
1. 实验样本(两种细胞系)
OVCA429
· 对照组 3个技术重复
· 实验组 3个技术重复
OVISE
· 对照组 3个技术重复
· 实验组 3个技术重复
2. 需要提前安装的软件
Max-Quant
质谱输出的RAW文件 导入Max-Quant 进行搜库,因为质谱的RAW文件是离子峰的峰谱,需要软件进行解谱,并与蛋白库匹配,得到蛋白信息。
Perseus
将Max-Quant 输出的表格输入到Perseus 中处理。如果有R语言基础建议用R语言处理。此软件比较复杂。
3. 数据库
(蛋白信息和蛋白序列,用于Max-Quant 搜库过程)
UniProt human sequence database
污染库
匹配环境污染的蛋白,然后去掉,本文用两种污染库
· 室内污染,包括 keratins, bovine proteins detected in FCS,trypsin
· 支原体库(本实验流程中容易引入,根据自己实验要求定。mycoplasma proteins database from UniProt
4. 定量方法
蛋白质组学定量方法有两种
·标记定量,即在样本中增加同位素标记,根据标记准确定量。
·非标定量,Label-free quantitation (LFQ),利用搜库软件的算法定量。计算一级质谱中每个肽段的信号强度在LC-MS色谱上的积分,利用MaxQuant软件(领先的蛋白质组学定性定量算法)解析这些肽段的定量信息,从而获得对应蛋白质的相对定量比值。
本文使用LFQ的方法,每一个细胞系的实验组和对照组一个6个样本合并搜库。输出一个表格,每个蛋白在实验组和对照组中的表达量信息。
5.差异蛋白的筛选
(分析画图等,建议R语言,文中使用Perseus 软件)
1.去除污染蛋白
2.处理缺失值
表达数据中有缺失值,一般认为缺失值是低于检测线,利用统计学的方法对缺失值进行补值。
3. 筛选差异蛋白 (P值和FC)
4.差异蛋白功能、通路等分析
GO
KEGG
PPI 蛋白和蛋白相互作用 ,文章中用IPA(收费),我们实战可使用String分析。