我做微生物组分析--经常用到了哪些R包
我做扩增子分析流程中常用的R包
下面介绍我常用的R包,还有一些R包比较底层,都会调用,但是不会被我们熟悉,也有一些R包我遗漏了,欢迎大家留言补充。
文件夹和文件管理
fs :
快速复制剪切文件,文件移动,大小统计等,基于高通量数据化整合我还专门使用fs写过一个R包Bigamplicon,用于结合爬虫批量下载和整理NCBI测序数据。
微生物组分析核心R包
phyloseq:
提供S4类对象封装和各种简单的微生物组学数据标准化和转化方法。
tidyverse:
使用tidy家族语法对微生物组数据进行清洗
tidyfst :
快速版本的dplyr, 对于宏基因组数据进行数据迅速清洗。
ggClusterNet:
衔接phyloseq包,扩展phyloseq对数据的标准化和转化方法,提供清洗微生物组数据的更方便的函数,并且可以完成微生物组网络分析,并且具有大量独一无二的可视化方法供大家选择。
二分网络绘制等
EasyStat :
封装非参数检验和t检验等内容,快速对微生物组数据进行差异分析和可视化。
vegan :
大量的生态学分析功能,目前引用超过1万次,被多个微生物组分析的R包所依赖,例如:
phyloseq,Microbiome等。
是微生物生态学分析中最重要的R包之一。
Microbiome 提供微生物组分析中常见功能分析函数,尤其是扩展了大量的alpha多样性指标。
picante:
提供系统发育等分析,通常结合vegan共同用于微生物组分析。
agricolae 提供统计检验方法能内容,用于微生物组数据的统计分析。
MASS :
提供LDA判别分析等内容,常见的LeFSe便是依赖了MASS包
Rtsne :
提供sne排序算法分析微生物组样本差异
edgeR DEsep2 limma :
对微生物组数据进行标准化和差异分析。
edgeR DEsep2 输入原始测序得到的微生物组计数数据。
limma 输入标准化后的微生物组数据。
randomForest e1071 caret :
randomForest,ROCR 提供随机森林算法,支持向量机等机器学习方法的函数对微生物组数据进行分析,ROCR对机器学习结果进行分析和可视化。
igraph,sna,ggraph,network tidygraph:
提供对微生物网络分析和可视化的支持。
ape Hmisc eulerr minpack.lm FSA等 提供系统发育分析等一些了微生物生态分析。
Hmisc用于统计分析和供给图表展示等,eulerr 做欧拉图,是韦恩图的变种。
minpack.lm 解决非线性最小二乘法等,ape主要用于系统进化树分析,通过核酸序列计算距离树。
FSA提供生态学的一些估计方法。
这些R包在做微生物群落系统发育过程中很有用。
psych WGCNA:
提供微生物之间香菇关系的计算等一些列运算。
plspm SEM plspm:
偏最小二乘路径分析,SEM:
结构方程模型分析
ggpubr 提供一些统计分析和可视化样式
绘图工具包
ggalluvial 提供冲击图和面积图等ggplot类图形绘制。
ggthemes ggsci:
提供丰富的图形可视化主题
RColorBrewer :
提供丰富的配色供图片使用。
ggrepel :
解决微生物数据标签重叠问题。
ggtree,data.tree,ggdendro,ggstance :
提供进化树等一系列相关可视化函数。
ggdendro可以进行进化树数据转化,方便实用ggplot进行联合绘图,微生物组常见的聚类柱状丰富图就可以使用这种方法绘制。
ggstance实现常见的ggplot2 geoms的水平版本。
VennDiagram UpSetR :
对不同样本或者分组微生物数量统计结果进行可视化。
UpSetR可以对超过6个分组进行共有和特有数量的展示,但是韦恩图一般只分组数量低于6个。
pheatmap aplot :
绘制微生物组差异热图等可视化,aplot可以结合ggtree和ggplot绘制ggplot版本的热图,方便使用ggplot语法进行修改。
ggstar :
提供了扩展ggplot中点形的绘图函数。
兼容ggplot,用法类似于geom_point。
丰富在多个分组的微生物组排序分析绘图点的多样性。
ggnewscale :
方便根据多个分组进行颜色映射,同一个图中允许多个颜色映射。
Cairo :
提供R语言绘图对字体的扩展
patchwork :
提供基于ggplot对象进行拼图的多种函数,并具有非常灵活的拼图样式。
circlize :
绘制微生物物种丰富的和弦图等
数据清洗
reshapes 提供长宽数据转化
plyr 提供累计求和等功能
apply :
提供对微生物组数据的高级清洗功能
parallel :
提供运算的速度,多线程操作。
stat 辅助数据整理,数据标准化等
功能预测
pathview :
提供代谢通路绘图
reference
https://cran.r-project.org/web/packages/states/index.html
https://cran.r-project.org/web/packages/Hmisc/index.html
https://cran.r-project.org/web/packages/eulerr/index.html
https://cloud.tencent.com/developer/news/180720