单细胞工具箱|Cell Ranger-V6.0 开启单细胞之旅(上)

Cell Ranger是一个10X genomics公司的单细胞分析软件,将原始的fastq文件生成后续分析的feature-barcode表达矩阵。其中包括很多模块,本次主要介绍cellranger mkfastq、cellranger count,cellranger aggr 和 cellranger reanalyze四个功能模块。

一 Cell Ranger下载安装1.1 下载进入cellranger官网(https://support.10xgenomics.com/)后,发现支持的分析模块有很多,先介绍单细胞转录组。选择单细胞转录组模块,点击进入

软件-下载-选择你想要的cellranger版本,https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

1)curl ,wget 和 直接网页下载,三种方式均可;2)记得下载注释文件3)注意查看md5值(很重要)1.2 安装Step1:解压下载的软件安装包#进入文件存放的位置,示例为opt$ cd /opt#解压$ tar -xzvf cellranger-6.0.1.tar.gz解压缩到一个名为cellranger-6.0.1的新目录,包含Cell Ranger及其依赖项和Cell Ranger脚本。Step2:同样的方式解压参考文件$ tar -xzvf refdata-gex-GRCh38-2020-A.tar.gzStep3:配置环境将Cell Ranger目录添加到$PATH中,注意路径要准确,示例为/opt ,$ export PATH=/opt/cellranger-6.0.1:$PATH为使用方便可以添加到.bashrc文件中。1.3 测试安装可以查看一下版本和帮助,或者参考官网的Site Check Script 的方式。cellranger -Vcellranger -h下载:https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest安装:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/installation二 mkfastq模块cellranger使用mkfastq功能来拆分Illumina 原始数据(raw base call (BCL)),输出 FASTQ 文件。

2.1 下载示例数据点击下载即可

2.2 Running mkfastq with a Simple CSV Samplesheet1)首先示例矩阵数据解压缩,当前目录下生成cellranger-tiny-bcl-1.2.0文件夹tar -xvzf cellranger-tiny-bcl-1.2.0.tar.gz2)Simple CSV Samplesheet文件格式:三列(Lane、Sample、Index),逗号分隔,不太容易出现格式错误。示例数据cellrangerver -tiny-bcl-simple-1.2.0.csv如下:Lane,Sample,Index1,test_sample,SI-TT-D9LaneWhich lane(s) of the flowcell to process. Can be either a single lane, a range (e.g., 2-4) or '*' for all lanes in the flowcell.SampleThe name of the sample. This name is the prefix to all the generated FASTQs, and corresponds to the --sample argument in all downstream 10x pipelines.Sample names must conform to the Illumina bcl2fastq naming requirements. Only letters, numbers, underscores and hyphens area allowed; no other symbols, including dots (".") are allowed.IndexThe 10x sample index that was used in library construction, e.g., SI-TT-D9 or SI-GA-A13)run mkfastq需要安装且配置bcl2fastq软件$ cellranger mkfastq --id=cellranger-tiny-bcl-1.2.0 \--run=/path/to/cellranger-tiny-bcl-1.2.0 \--csv=cellranger-tiny-bcl-simple-1.2.0.csvid :即为解压后的文件夹名字run:为解压后的文件夹的绝对路径在id名的新文件夹中既有生成的fastq文件了,可以用于后续的count分析。另一种请参考https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/mkfastq三 count 模块此处使用转录组数据进行count分析,通过fastq文件得到细胞和基因的定量结果。3.1 必要参数$ cellranger count --id=sample345 \--transcriptome=/opt/refdata-gex-GRCh38-2020-A \--fastqs=/home/jdoe/runs/HAWT7ADXX/outs/fastq_path \--sample=mysample \--expect-cells=1000 \--id= 名称--fastqs= fastq.gz文件保存的绝对路径--sample= fastq.gz文件名"-"之前的字段--transcriptome= 参考基因组路径--expect-cells= 期望细胞数(可选)3.2 参数列表参数详细介绍详见:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/count#args中的Command-Line Argument Reference 部分可以注意下以下参数:--expect-cells(optional) Expected number of recovered cells. Default: 3,000 cells.和实验匹配--nosecondary(optional) Add this flag to skip secondary analysis of the feature-barcode matrix (dimensionality reduction, clustering and visualization). Set this if you plan to use cellranger reanalyze or your own custom analysis.仅获得表达矩阵,不进行后续的降维,聚类和可视化分析--chemistry(optional) Assay configuration. NOTE: by default the assay configuration is detected automatically, which is the recommended mode. You should only specify chemistry if there is an error in automatic detection. Select one of:auto for auto-detection (default),...3.3 结果文件结果文件列表以及简要描述说明File NameDescriptionweb_summary.htmlRun summary metrics and charts in HTML format网页简版报告以及可视化metrics_summary.csvRun summary metrics in CSV formatpossorted_genome_bam.bamReads aligned to the genome and transcriptome annotated with barcode informationpossorted_genome_bam.bam.baiIndex for possorted_genome_bam.bamfiltered_feature_bc_matrixFiltered feature-barcode matrices containing only cellular barcodes in MEX format. (In Targeted Gene Expression samples, the non-targeted genes are not present.)过滤掉的barcode信息filtered_feature_bc_matrix_h5.h5Filtered feature-barcode matrices containing only cellular barcodes in HDF5 format. (In Targeted Gene Expression samples, the non-targeted genes are not present.)过滤掉的barcode信息HDF5 format;raw_feature_bc_matricesUnfiltered feature-barcode matrices containing all barcodes in MEX format原始barcode信息raw_feature_bc_matrix_h5.h5Unfiltered feature-barcode matrices containing all barcodes in HDF5 format原始barcode信息HDF5 formatanalysisSecondary analysis data including dimensionality reduction, cell clustering, and differential expressionmolecule_info.h5Molecule-level information used by cellranger aggr to aggregate samples into larger datasetscloupe.cloupeLoupe Browser visualization and analysis fileLoupe Cell Browser 输入文件feature_reference.csv(Feature Barcode only) Feature Reference CSV filetarget_panel.csv(Targeted GEX only) Targed panel CSV file参考资料:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/mkfastq◆ ◆ ◆  ◆ ◆精心整理(含图PLUS版)|R语言生信分析,可视化(R统计,ggplot2绘图,生信图形可视化汇总)

(0)

相关推荐

  • 同样的流程为什么有时候会失败呢

    前些天我发布了 cellranger更新到4啦,提到了可以免费做一下10X的单细胞转录组数据上游分析,反正刚刚购买的服务器闲着也是闲着.其中一个项目是12个样品的10X的样本的fastq测序原始数据, ...

  • 想分析单细胞RNA的动态变化?

    当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步.不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长. 文献速递栏目通过简 ...

  • 溜得飞起的单细胞bus你还不上车?

    谷歌邮箱推送给我了关键词订阅文献,单细胞的,我看到如下所示:   下意识的以为是有人把单细胞数据分析流程总结成为了一个地铁线路图或者公交车线路图,因为我们生信技能树VIP群里这两天有人把一下NGS分析 ...

  • cellranger更新到6.0啦

    不知不觉cellranger已经更新到6.0了.前面已经介绍了4.5,今天介绍下6.0 cellranger更新到4啦(全新使用教程) cellranger更新到5啦(全新使用教程) CellRang ...

  • 10X单细胞测序之cellranger介绍

    简介目前10X单细胞测序算是测序行业最热门的方向之一,它可以在低测序深度的情况下一次性的获得成千上万的细胞及其每个细胞内的基因表达情况,对了解细胞异质性和新的细胞类型非常有利.官网介绍的功能和优势如下 ...

  • 什么,ENA和SRA数据库存放的单细胞转录组测序数据并不一致啊?

    是时候把生信技能树的舞台交给后辈! 粉丝来稿 作者:黑川五郎 写在前面 单细胞转录组以10X公司为主流,单细胞天地公众号详细介绍了cellranger流程,大家可以自行前往学习,如下: 单细胞实战(一 ...

  • 明码标价之10X转录组原始测序数据的cellranger流程

    冷知识:其实一个10X单细胞转录组样品可以有多达84个fastq文件哦! 我们在单细胞天地多次分享过cellranger流程的笔记,大家可以自行前往学习,如下: 单细胞实战(一)数据下载 单细胞实战( ...

  • scRNA-seq表达矩阵的构建

    书籍翻译 好的书籍是人类进步的阶梯,但有些人却找不到优秀的阶梯,为此我们开设了书籍翻译这个栏目,作为你学习之路的指路明灯:分享国内外优秀书籍,弘扬分享精神,做一个知识的传播者. 希望大家能有所收获! ...

  • 仅3个单细胞测序样本怎么撑起6分的文章?

    导语 今天和大家分享的是2020年1月份发表在SCIENTIFIC DATA杂志上的一篇文章(IF=5.929)"Single-cell RNA sequencing of human ki ...

  • 文章的最高境界-让人无法重复出来???

    看到2020年2月发表在nature cancer这个新杂志的文章<Single-cell analyses reveal increased intratumoral heterogeneit ...

  • 起了个大早,赶了个晚集

    看到了一个预印本研究成果,标题很霸气:<Cell atlas of human uterus>,Posted February 19, 2018. 链接是https://www.biorx ...

  • MPB:深大李猛组-基于PacBio SMRT三代测序的红树林沉积物真菌群落的研究

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

  • 非正常数据读取——之仅有bam文件

    我所理解的cellranger软件理想原始输入数据就是SRA格式,然后利用sra-tools分为read.barcode+UMI.index三个fastq.gz文件.最后直接利用cellranger即 ...