SpatialExperiment || 空间数据管理
男,
一个长大了才会遇到的帅哥,
稳健,潇洒,大方,靠谱。
一段生信缘,一棵技能树。
生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家。
我们知道单细胞数据的激增和它的高维特征催生了针对单细胞数据的数据格式:Seurat对象、singlecellexperiment对象以及anndata对象。空间数据的出现为表达量数据带来了新的视角,一般它包含图像数据,空间坐标数据以及表达量数据。虽然以上三种数据格式可以轻松地把空间信息包装起来,但是为了凸显空间位置的重要性,人们开发了与单细胞的singlecellexperiment类似的SpatialCellExperiment用于空间数据管理与分析。当然,另一个R包:SpatialExperiment 也在不断地完善中。
那么,我们不禁要问为什么之前的单细胞数据格式可以轻松地包装空间数据,还要开发类似SpatialCellExperiment呢?我们知道,毕竟单细胞的是单细胞的,虽然在数据格式上可以很好地容纳,毕竟内核部分没有针对空间分析方法。比如,SpatialCellExperiment 封装了sf
提供了对空间数据分析的支持,这是一种编码空间向量数据的标准化方法。可用来实现一个SpatialPolygonExperiment类,包含精确的细胞亚群几何形状以及基因和文库元数据(metadata )。也即,表面看SpatialCellExperiment 只是加了XY轴,其实内在封装了空间分析的一般方法,如,一种中间建模方法可以是按平铺法进行,即将观测空间均匀划分为规则区域。然后,每个tile (区域)反映相应区域检测到的特征。请注意,tiles可以是矩形、六边形,或者任何可以将平面划分为规则网格的多边形。
我们曾经在空间信息在空间转录组中的运用和应用空间统计学分析空间表达数据看到过如果没有专门的空间数据格式,如何自己调用(地理的)空间分析R包先做对象转换再做分析的过程。数据分析中50%的时间在数据格式的处理,有了空间表达数据的格式可以缩短这部分时间,把我们从对象转换的藩篱中解放出来。当然这在Seurat或anndata中可能就是as.XXX的函数以完成数据格式转化,分析交给做空间的工具。前提是我们要有空间表达数据分析工具。
目前我们看到的主要R包是SpatialCellExperiment和SpatialExperiment,完善程度可能还没有singlecellexperiment那么高,但是至少我们看到了人们在切片上挖掘信息的努力。
空间分析常用的R包:
sp spatstat spdep fields spatclus geoR rgdal
大量的空间数据分析工具正在开发中,每一个工具都是一个新的视角。
References
[1]
https://kevinrue.github.io/SpatialCellExperiment/articles/SpatialCellExperiment.html
[2]
https://bioconductor.org/packages/release/bioc/html/SpatialExperiment.html
[3]
http://www.bioconductor.org/help/course-materials/2020/HCASymposium/06-ChallengesAndOpportunities.pdf
看完记得顺手点个“在看”哦!