Seurat 4.0 ||您的单细胞数据分析工具箱上新啦

男,

一个长大了才会遇到的帅哥,

稳健,潇洒,大方,靠谱。

一段生信缘,一棵技能树。

生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家。

随着单细胞技术的成熟,同一细胞内的信息越来越多被揭晓。在转录组时代,我们说单细胞是一个rna的盒子,细胞类型是基因特异性表达的结果。现在,我们可以说单细胞是中心法则的反应器,DNA,rna,atac,膜蛋白,等等等等,都在细胞中生成与反应。

为了顺应(某种意义上也是推动)单细胞技术的发展,最大限度地打开我们的视野。单细胞数据分析工具箱Seurat,更新到了4.0版本(Beta版)。

Integrative multimodal analysis.(为单细胞多模态分析提供新算法)

从同一细胞同时测量多种数据类型的能力,称为多模态分析,代表了单细胞基因组学的一个新的和令人兴奋的前沿。在Seurat v4中,我们引入了加权最近邻(WNN)分析,这是一种无监督策略,用于学习每个细胞中每个模态的信息内容,并基于两种模态的加权组合来定义细胞状态。在我们新的预印本中,我们生成了一个CITE-seq数据集,其中包含转录组和228种表面蛋白的配对测量,并利用WNN定义了人类PBMC的多模态参考基。您可以使用WNN分析来自各种技术的多模态数据,包括CITE-seq、ASAP-seq、10X Genomics ATAC + RNA和SHARE-seq。

  • Preprint: Integrated analysis of multimodal single-cell data(https://satijalab.org/v4preprint)
  • Vignette: Multimodal clustering of a human bone marrow CITE-seq dataset(https://satijalab.org/seurat/v4.0/weighted_nearest_neighbor_analysis.html)
  • Portal: Click here(https://atlas.fredhutch.org/nygc/multimodal-pbmc/)
  • Dataset: Download here(https://atlas.fredhutch.org/data/nygc/multimodal/pbmc_multimodal.h5seurat)

Schematic overview of multimodal integration using Weighted NearestNeighbor analysis(WNN) (A, B) Independent analysis of transcriptome (A) and protein (B) modalities from a CITE-seq dataset of cord blood mononuclear cells. Blue dot marks the same target cell in (A) and (B). Red dots denote the k=20 nearest neighbors to the target cell based on the transcriptome (A) or protein (B) modalities. (C) The RNA neighbors are averaged together to predict the molecular contents of the target cell, which can be compared to the actual measurements. Since the RNA neighbors represent a mixture of different T cell subsets, there is substantial error between predicted and measured protein expression levels for CD4 and CD8. (D) Same as in (C), but averaging protein neighbors. Since protein neighbors are all CD8 T cells, the predicted values are close to the actual measurements. We can therefore infer that for this target cell, the protein data is most useful for defining cell state, and assign it a higher protein modality weight. As described in Supplementary Methods, we perform the prediction and comparison steps in low-dimensional space. (E) We can integrate the modalities by constructing a Weighted Nearest Neighbor (WNN) graph, based on a weighted average of protein and RNA similarities. UMAP visualization and clustering of this graph. (F) Median RNA and protein modality weights for all cell types in the dataset. Modality weights were calculated for each cell without knowledge of cell type labels.

Rapid mapping of query datasets to references.(高质量的参考数据集与在线版本上线)

我们提供了Azimuth,一个利用高质量参考数据集快速映射新的scRNA-seq数据集(查询)的工作流。例如,您可以将人类PBMC的任何scRNA-seq数据集映射到我们的references上,从而自动化可视化、聚类注释和差异表达的过程。Azimuth可以在Seurat内运行,也可以使用不需要安装或编程经验的独立web应用程序运行。

  • Vignette: Mapping scRNA-seq queries onto reference datasets(https://satijalab.org/seurat/v4.0/reference_mapping.html)
  • Web app: Automated mapping, visualization, and annotation of scRNA-seq datasets from human PBMC(https://satijalab.org/azimuth/)

速度与继承

速度和可用性更新:我们在v4中做了一些小的修改,主要是为了提高Seurat v4在大型数据集上的性能。这些更改极大地提高了速度和内存需求,但不会对下游结果造成不利影响。我们在这里提供了关键更改的详细描述。希望完全重现现有结果的用户可以通过继续安装Seurat v3继续这样做。

我们相信,熟悉Seurat v3的用户应该能够平稳地过渡到Seurat v4。虽然我们引入了大量的新功能,但现有的工作流、函数和语法在这次更新中基本没有变化。此外,以前在Seurat v3中生成的Seurat对象可以无缝地装载到Seurat v4中以进行进一步分析。


参考:

  • https://satijalab.org/seurat/
(0)

相关推荐

  • 多模态学习,英文全称 MultiModa...

    多模态学习,英文全称 MultiModal Machine Learning (MMML),从1970年代起步.已经经历了多个发展阶段,在2010后,全面进入深度学习的阶段.多模态机器学习,以机器学习 ...

  • 仅3个单细胞测序样本怎么撑起6分的文章?

    导语 今天和大家分享的是2020年1月份发表在SCIENTIFIC DATA杂志上的一篇文章(IF=5.929)"Single-cell RNA sequencing of human ki ...

  • 单细胞工具箱|Seurat官网标准流程

    学习单细胞转录组肯定先来一遍Seurat官网的标准流程. 数据来源于Peripheral Blood Mononuclear Cells (PBMC),共2700个单细胞, Illumina Next ...

  • 生信实操丨带你复现单细胞转录组纯分析文章(一)

    生信实操 随着测序技术的进步开发了一种单细胞转录组测序(scRNA-seq)技术,单细胞转录组测序技术可以一次检测成千上万个细胞的转录水平,在单细胞水平上检测和定量基因表达水平变化,从而揭示bulk ...

  • Seurat 4.0 ||单细胞多模态数据整合算法WNN

    男, 一个长大了才会遇到的帅哥, 稳健,潇洒,大方,靠谱. 一段生信缘,一棵技能树. 生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家. 跟着Seurat团队学数学,从KNN到S ...

  • Seurat 4.0 || 单细胞PBMC多模态参考数据集

    男, 一个长大了才会遇到的帅哥, 稳健,潇洒,大方,靠谱. 一段生信缘,一棵技能树. 生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家. 前情回顾 Seurat 4.0 ||您的 ...

  • Seurat 4.0 || 单细胞BMNC多模态参考数据集

    男, 一个长大了才会遇到的帅哥, 稳健,潇洒,大方,靠谱. 一段生信缘,一棵技能树. 生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家. 前情回顾 Seurat 4.0 || 您 ...

  • 这样学Python,数据分析从0到1轻松入门(上)

    大家好,我是写BUG的一行,大家可以叫我一行,今天带领大家进行Python从入门到提高的学习路程.首先我们先对Python有个基本的了解和清晰的概念,然后再一步一步从基础开始提升,进而全面开启你的Py ...

  • 单细胞系列停更通知及组建单细胞数据分析交流小组

    跟单细胞结缘已久,早在三年前我还是药厂生信工程师的时候就接触过一些前沿团队,听了他们的讲座后我就下意识的搜索了相关资料,了解到了欧洲的EMBL-EBI在组建十几个单细胞研究中心,也在全球范围内招聘RA ...

  • 想仅报名单细胞数据分析学习班,请先独立完成一个R考核题

    最近我们生信技能树发布了一年一度的单细胞线下5天学习班 一年一度的生信技能树单细胞线下培训班火热招生 报名者众多,有趣的是大部分人对前面的3天生物信息学基础知识课不感兴趣,想直接报名2天的单细胞学习班 ...

  • 如何直接用Seurat读取GEO中的单细胞测序表达矩阵

    如何直接用Seurat读取GEO中的单细胞测序表达矩阵

  • R : Shiny|搭建单细胞数据分析云平台

    男, 一个长大了才会遇到的帅哥, 稳健,潇洒,大方,靠谱. 一段生信缘,一棵技能树, 一枚大型测序工厂的螺丝钉, 一个随机森林中提灯觅食的津门旅客. 前言 shiny官网(https://shiny. ...

  • 跟着大神学单细胞数据分析

    前言 这是 Tang Ming 大神分享的单细胞分析的seurat流程.今天我们来理一下大致的分析思路,当然里面好多细节的部分还需要自己下功夫慢慢研究. 原文链接如下: https://crazyho ...