trendsceek || 识别基因空间表达趋势

男,

一个长大了才会遇到的帅哥,

稳健,潇洒,大方,靠谱。

一段生信缘,一棵技能树。

生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家。

Identification of spatial expression trends in single-cell gene expression data

空间转录组技术使得我们可以在组织成像的基础上考察基因表达情况,同时也需要新的分析策略。trendsceek是一种基于标记点过程的方法,识别具有显著空间表达趋势的基因。trendsceek在空间转录组和顺序荧光原位杂交数据中都能很好地发现空间差异基因,并在单细胞RNA-seq数据的低维投影(TSNE/umap)中揭示了显著的基因表达梯度和热点。

library(trendsceek)
library(Seurat)
library(SeuratData)

AvailableData()

stxBrain.SeuratData::anterior1 -> sto 
head(sto@images$anterior1@coordinates)

tissue row col imagerow imagecol
AAACAAGTATCTCCCA-1      1  50 102     7475     8501
AAACACCAATAACTGC-1      1  59  19     8553     2788
AAACAGAGCGACTCCT-1      1  14  94     3164     7950
AAACAGCTTTCAGAAG-1      1  43   9     6637     2099
AAACAGGGTCTATATT-1      1  47  13     7116     2375
AAACATGGTGAGAGGA-1      1  62   0     8913     1480

pp = pos2pp(sto@images$anterior1@coordinates[,c(2,3)])
log.fcn = log10
counts_sub[1:2,1:4]
pp = set_marks(pp, as.matrix(sto@assays$Spatial@counts), log.fcn = log.fcn)

min.ncells.expr = 3
min.expr = 5
counts_filt = genefilter_exprmat(as.matrix(sto@assays$Spatial@counts), min.expr, min.ncells.expr)
dim(counts_filt)

quantile.cutoff = 0.9 ##filter out the most lowly expressed genes from the fitting
method = 'glm' ##For (robust) linear regression set to 'rlm'
vargenes_stats = calc_varstats(counts_filt, counts_filt, quant.cutoff = quantile.cutoff, method = method)

n.top2plot = 10
topvar.genes = rownames(vargenes_stats[['real.stats']])[1:n.top2plot]
pp2plot = pp_select(pp, topvar.genes)
plot.ercc.points = FALSE
plot_cv2vsmean(vargenes_stats, topvar.genes, plot.ercc.points = plot.ercc.points)

min.count = 1
counts_norm = deseq_norm(as.matrix(sto@assays$Spatial@counts), min.count)
counts_sub = counts_norm[topvar.genes, ]
dim(counts_sub)
plot_pp_scatter(pp2plot, log_marks = FALSE, scale_marks = FALSE, pal.direction = -1)
nrand = 100
ncores = 1

##run
trendstat_list = trendsceek_test(pp2plot, nrand, ncores)
trendstat_list

head(trendstat_list$sig_genes_list$Vmark)
           gene  test earlystop max.env.rel.dev max.rel.dev   min.pval nsim_max nsim_stop      p.bh      p.bo rank
S100a5   S100a5 Vmark         0        6.898791  0.29728032 0.00990099        2         2 0.0110011 0.0990099    1
Fabp7     Fabp7 Vmark         0        5.392828  0.12836321 0.00990099        2         2 0.0110011 0.0990099    2
Ptgds     Ptgds Vmark         0        3.491384  0.09823452 0.00990099        2         2 0.0110011 0.0990099    3
Clca3a1 Clca3a1 Vmark         0        3.075842  0.35753230 0.00990099        2         2 0.0110011 0.0990099    4
Ttr         Ttr Vmark         0        2.962141  0.10187457 0.00990099        2         2 0.0110011 0.0990099    5
Kl           Kl Vmark         0        1.762761  0.11802672 0.00990099        2         2 0.0110011 0.0990099    6

alpha = 0.05 ##Benjamini-Hochberg
sig_list = extract_sig_genes(trendstat_list, alpha)
lapply(sig_list, nrow)
sig_genes = sig_list[['markcorr']][, 'gene']
plot_trendstats(trendstat_list, sig_genes[1])

plot_pp_scatter(pp_sig, log_marks = FALSE, scale_marks = FALSE, pal.direction = -1,pointsize.factor = 1)


References

[1] https://github.com/edsgard/trendsceek
[2] Edsgärd D. et al., Identification of spatial expression trends in single-cell gene expression data, Nature Methods, 2018: doi:10.1038/nmeth.4634



如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程

看完记得顺手点个“在看”哦!

生物 | 单细胞 | 转录组丨资料
每天都精彩
(0)

相关推荐

  • 转录组学习七(差异基因分析)

    任务 载入表达矩阵,然后设置好分组信息 用DEseq2进行差异分析,也可以走走edgeR或者limma的voom流程 基本任务是得到差异分析结果,进阶任务是比较多个差异分析结果的异同点. 了解差异基因 ...

  • pandas与seaborn可视化对比小案例

    Python网络爬虫与文本数据分析(视频课) 之前分享过pandas也是可以作图的,今天复习一下pandas作图,并与seaborn做对比,熟悉下各自绘图的特点. 导入用到的库 import pand ...

  • YelpDaset: 酒店管理类数据集10+G

    线上课程  精选课 | Python网络爬虫与文本数据分析(学术) 线下课程  2020杭州Python&Stata数据分析课寒假工作坊 在昨天发的  综述:文本分析在市场营销研究中的应用  ...

  • 植物基因过表达技术原理

    基因过表达是指将一目标基因克隆到一个携带有强启动子和抗性筛选标记等元件的载体上,然后导入植物体内,这样宿主细胞会获得较高量的目标mRNA转录水平和蛋白表达水平,从而通过表型等分析可以研究该基因的功能. ...

  • 基因共表达技术实验流程

    将外源基因(如Cre.EGFP.mCherry或LacZ等基因)插入内源基因终止密码子之前,引入外源基因的同时不破坏内源基因的表达,实现内源基因和外源基因的共表达. 基因共表达技术优势 直接在受精卵阶 ...

  • 定点基因过表达小鼠技术实验流程

    Rosa26基因在大部分组织和细胞中都有持续表达,因此在这个区域定点插入外源基因,可以实现目的基因在各组织和细胞类型中的广泛表达. 定点基因过表达技术优势 可获得身体大部分组织和各类型细胞中稳定表达外 ...

  • 首发 | 元禾大千 · 艺术基因 空间的序列语言

    WWW.DINZD.COM | 土地利用规划图 将DNA刻入产业内核 博鳌乐城国际医学产业中心位于三亚海南,是国际医疗旅游目的地.尖端医学研发和转化基地.国家级新医疗机构集聚地,也是生态公园的环绕地. ...

  • 科研│PLANT J:基因共表达分析揭示干旱胁迫下野生和栽培鹰嘴豆转录组的差异

    编译:微科盟 伊一,编辑:微科盟景行.江舜尧. 原创微文,欢迎转发转载. 导读 作物野生亲缘物种的祖先适应性可以为作物改良提供遗传储备.在这里,研究者记录了野生和栽培鹰嘴豆的轻度和重度干旱胁迫的生理变 ...

  • 科研 | PLANT CELL ENVIRON: 壳聚糖引发植物对灰葡萄孢的防御机制,包括Avr9/Cf-9快速诱导基因的表达

    编译:Nicole,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读 当前针对真菌病原灰葡萄孢的防控策略依赖于常规杀真菌剂和宿主遗传抗性的组合,然而这些策略不足以保护植物免受这侵害.植物诱抗剂可以 ...

  • 评论 | 我们食用的MicroRNAs是否会影响基因的表达?

    编译:小北,编辑:夏甘草.江舜尧. 原创微文,欢迎转发转载. 导读 研究表明,遗传物质可以从饮食中转移.但是一些研究人员对此表示怀疑.本文就这一科学问题进行了论述. 论文ID 原 名:Do the m ...

  • 科研 | J Exp Med:转录组揭示PRDM16抑制肾癌中HIF靶向基因的表达

    编译:阿温,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 转录组数据分析表明在肾癌(RCC)中转录因子PRDM16的表观遗传基因沉默.研究者发现在RCC细胞中恢复PRDM16可以抑制体内肿瘤的 ...

  • 科研 | Nature:自然选择如何影响水稻基因的表达?

    编译:秦时明月,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 基因表达是组织表型的基础,但影响基因表达的自然选择性质及其在适应力进化中的作用仍不清楚.在本篇文章中,纽约大学的研究人员分析了水稻(Or ...