关于人类细胞图谱项目详细再现性的案例研究

当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步。不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长。

文献速递栏目通过简短介绍,扩充知识面,每天关注,希望你也能有所收获!

文章信息
本期文章于2019年6月发表于Quantitative Biology。文章题目是:A case study on the detailed reproducibility of a Human Cell Atlas project.

摘要

Human Cell Atlas(HCA)项目旨在为健康人体的所有细胞类型构建一套全面的“Google地图”。生物信息学处理中的细微差异可能会导致所得到的地图产生巨大差异,为了研究如何在当前实践中达到重复性,我们对最近的细胞图谱工作进行了详细的案例研究。这篇文章实验结果有助于保护未来HCA项目的可重复性。

https://github.com/XuegongLab/HCA

https://github.com/XuegongLab/HCA-reproducibility

测序数据介绍   

  • 工具:Deep scRNA-seq

  • 测序对象:768 DCs and 372 monocytes derived from a single healthy people

  • HCA-reproducibility代码和数据:https://github.com/XuegongLab/HCA-reproducibility

数据分析情况   

质控   

通过基因丰度阈值(reads count, FPKM, TPM or other abundance estimation)过滤掉低质量细胞:The cutoff of low-frequency genes is usually selected as 3 cells or some fraction of total cells (say 0.5%)

去除批次效应

  • 检测:PCA,t-SNE

  • 去除:分析批次指标变量和细胞中检测到的基因数量来恢复基因表达。

  • 在下游分析中,使用Z-评分残差校正基因表达。

去除污染的细胞亚群后

Gene Selection and PCA

质控前后marker genes对比

t-SNE可视化前后对比

意义 

在这个重复实验中,为了保证我们得到的所有结果都能被第三方再次验证,我们创建了一个记录生物信息学处理的所有细节和相应的实时代码的笔记本,以确保再现性所做的努力可作为所有HCA项目的例子。

(0)

相关推荐