科研 | 森林土壤微生物功能组织的遗传相关网络预测(国人作品)
本文由熊志强编译,董小橙、江舜尧编辑。
原创微文,欢迎转发转载。
土壤生态功能在很大程度上取决于土壤微生物的活动,而微生物的活动又受到基因与其相应途径的相互作用的调控。因此,遗传网络可以从理论上阐明复杂的微生物群落功能的功能组织。基于森林土壤中提取到的5421个基因,作者构建了一个遗传相关网络,鉴定了7191个正相关关系和123个负相关关系。这一网络由27个集群组成,它们在特定功能范围内富集了一系列基因,并以相应的集群式中心表示。这种集群显示出一种层次结构,反映了土壤宏基因组的功能组织。正相关映射功能关联,而负相关性往往映射调控过程。根据定位集群的功能预测了未知基因的潜在功能。全球遗传相关网络突出了土壤宏基因组中的功能组织,为预测基因功能提供了一种资源。作者预计,遗传相关网络可用于全面解释土壤微生物群落功能。
论文ID
原名:Genetic correlation network prediction of forest soil microbial functional organization
译名:森林土壤微生物功能组织的遗传相关网络预测
期刊:The ISME Journal
IF:9.520
发表时间:2018年
通信作者:Jianming Xu
通信作者单位:浙江大学
实验内容
1 原始森林土壤宏基因组的全球遗传相关网络
基于45个土壤宏基因组中被注释到的5421个基因的相对丰度,利用Spearman相关系数矩阵构建了一个遗传相关网络。基因相关网络包含2641个节点,7314个不同连接,这其中包括7191个正相关连接和123个负相关连接(图1a)。其核心基因(在所有的45个宏基因组中均有发现的基因)的子网络由1635个节点和4135个连接组成(图1d),而非核心基因的子网络由826个节点和1374个连接组成(图1c)。总的来说,核心基因与非核心基因之间存在1805个连接。虽然核心基因和非核心基因在子网中的网络密度值相似,但核心基因子网络(图1c)的聚类系数比非核心基因子网络(图1d)的聚类系数大两倍。同时核心基因子网络的直径大于全球网络中的直径(表S1)。
基于探索式的方法探究整个网络图谱发现,其中基因显示出相似的连接轮廓。我们共检测到27个优势集群,其中包括1704个强度节点。而其余757个不属于这些集群的节点被视为松散节点。在这27个优势集群中,其中24个属于核心基因子网络,3个属于非核心子网络(图1b-c)。位于网络布局外围(集群1-23)的23个集群的连接强度大于位于中心的四个集群的连接强度(图1a)。与这27个集群相关联的大多数连接都是集群内连接,它们将来自同一集群的节点连接起来,连接不同集群的集群间连接主要出现在集群24-26中(图1d)。
图1 遗传相关关系网络。a利用遗传相关矩阵构造了一个包含所有核心基因和非核心基因的全局遗传相关网络,将Spearman系数>0.818的基因对连接起来,相关系数较高的基因相距较近,而相关系数较低的基因相距较远。采用多级聚集方法对全局网络中的集群进行检测,27个优势集群以不同的颜色表示;b在24个集群中占主导地位的核心基因的遗传相关子网络;c一个以三个集群为主导的非核心基因的遗传相关子网络;d集群内部和集群间的连接频率,方格大小反映了在全球遗传相关网络中观察到的给定对集群的连接频率。
表S1 Erdős-Renyi网络、全遗传网络和核心与非核心基因子网络的拓扑性质
通过从全局网络中提取子集群并将它们分组可视化,能够更详细地解决了集群中关联的功能关系(图2)。相似功能相关的基因往往在同一簇中相互关联。核心基因子网络(图1b)主要包括蛋白质和核酸代谢过程、养分利用、免疫、氧化/还原和催化过程有关的集群(图2a-d),而非核心基因子网络则由与应激反应、免疫和膜结构相关的基因组成的集群组成(图2d)。虽然每个属的聚类数与属的丰度不成线性相关(图S5a),普遍功能性的属的丰度(每个属的聚类数≥20)显著高于稀有的属(每个属的聚类数≤5,P=0.05)和中等普通属(6≤每个属的聚类数≤19,P=0.04)的丰度(图S5b)。普遍存在的属中主要为Firmicutes,而稀有的属主要为Bacteroidetes(图S5c)。在属水平上,Capnocytophaga只参与运输过程(第10集群)和核酸代谢过程(第23集群),Rhodothermus只参与氮代谢过程(第9集群)、运输过程(第11集群)、催化活性过程(第12集群)和免疫过程(第26集群)(图S4)。
图2 遗传相关网络中的集群。a位于集群1-8中的基因;b位于集群9-15中的基因;c位于集群16-23中的基因;d位于集群24-27中的基因。
图S4 遗传相关网络中基因集群的分类特征。
图S5 遗传相关网络聚类中的属概述。a 丰度与属的呈现的集群的关系;b 功能性的(每个属的聚类数≥20),中等存在的(6≤每个属的聚类数≤19)以及稀有的(每个属的聚类数≤5)属的丰度分布;属的分类为功能性的、中等的和稀有的。
2 遗传相关网络的集群枢纽
总的来说,从27个优势集群中我们发现了59个集群枢纽基因(每个集群中具有最多连接数的基因)(图3a)。我们鉴定出22个枢纽基因为集群间基因,37个枢纽基因为集群内基因,这其中包括48个核心基因以及11个非核心基因。核心枢纽基因主要定位于以核心基因为主的集群(集群1-23),而非核心枢纽基因主要定位于以非核心基因为主的集群(集群24-27)。同样,集群内枢纽基因主要分布在以核心基因为主的集群内,集群间枢纽基因主要定位在以非核心基因为主的集群内(图3b)。集群内核心基因与相应集群内的基因紧密相连(图3b),同时与相应集群的功能相关联。例如,(i)水解酶结构域编码基因RadC,Hydrolase以及Pro-kuma-activ是集群内与氧化还原过程或催化活性相关的枢纽;(ii)膜蛋白基因MgtC是与运输过程相关的集群的枢纽;(iii)结合蛋白基因SHOCT是与金属集群结合的集群的枢纽;(iv)聚磷酸激酶基因(Ppx)是与磷代谢相关的集群的枢纽。相反,集群间枢纽基因为集群间的关联提供了基础(图3b)。例如,结合蛋白基因HTH_18和PrlF_antitoxin在运输过程(第20集群)、核酸代谢(第21集群和第23集群)和细胞内部分(第22集群)之间起连接作用。外膜蛋白基因在运输过程(第10集群)、氮利用(第9集群)和催化过程(第11集群)之间连接。
图3 在不同分辨率(R)的全球遗传相关网络中聚类的层次结构。不同的同级集群(兄弟集群)在层次级别的一个分辨率级别上解析,在较高级别上组合在一起生成一个更大的母集群,这表明其同级集群之间的功能密切相关。
3 遗传相关网络中集群的层次结构
为了探究集群间的功能关系,我们通过调整集群检测方法的分辨率值(R)从1到15来检测集群的层次结构(图4)。通过将R设为1来检测上述27个簇(图4)。在相对较低的分辨率水平(R=5)中,几个兄弟集群折叠为具有相同或密切相关功能的母簇,例如第1集群(铁硫簇结合)和第6集群(催化活性)、第9集群(氮利用过程)和第10集群(离子运输过程)等。在分别率水平R=9时,我们发现两个较大的母簇,其兄弟簇不具有密切相关的功能,而是来自相同的间隔。例如,这两个母簇中的一个与膜部件的兄弟集群(集群14、22、26和27)和相关的功能,如运输过程(集群15和16)相结合;而另一个母簇与兄弟集群结合,用于胞内功能,例如核酸代谢过程(集群4和21)和氧化还原过程(集群7)。在高分辨率水平时(R=13),这两个大的母簇被进一步合并成一个母簇,连同金属迁移和结合过程的簇(第1集群和第20集群)。在这个层次上,蛋白质代谢过程(第2集群)、异生物降解(第18集群)和氮利用过程(第9集群)的群集仍然独立于大型亲本集群。氮利用过程团集群与富集离子通道蛋白(集群10)、催化活性(集群11)和氧化还原(集群12)密切相关。
图4 基因相关网络中高度连接的枢纽基因。a27个优势集群和松散连接节点的集群内和集群间连接数,核心基因是27个优势集群中连接数最多的网络节点。核心基因被鉴定既包括集群间连接的集群间核心基因(黄色)或集群内连接而没有集群间连接的核心基因(蓝色)。通过抖动调整了点的位置,以防止重叠。b全球遗传相关网络中集群内(蓝色)和集群间(黄色)枢纽基因的连接。
4 遗传相关网络中的负相关连接
负相关连接主要是集群25-27中的连锁基因和不同集群间的连接基因(图5a-b)。大多数连接负相关的节点都是非核心基因(图5c),其中一半的负相关连接是核心基因和非核心基因之间的连接,只有5个负相关连接是核心基因与核心基因之间的连接(图5d)。除29个功能未知的基因外,与负相关连接的相关基因编码蛋白主要涉及催化活性、代谢过程、膜蛋白、发育过程和运输过程(图5e)。编码非核心基因Rick_17kDa_Anti,Fe_hyd_lg_C以及Ribosomal_S6e的基因与其他基因有显著的负相关关系(P<0.001)(图5f)。负相关所连接的基因一般来自不同的功能类别(图5f)。
图5 遗传相关网络中的负相关连接。a 负相关连接的位置;b 负相关连接分布;c与负相关的核心和非核心基因的丰度;d非核心基因(n-n)、非核心基因与核心基因(n-e)、核心基因(e-e)之间的负相关关系丰度;e负相关基因的遗传功能分类;f负相关网络的子网络。节点的颜色表示功能分类。节点的大小显示负相关连接的数量。
5 未知基因功能预测
全球相关网络由573个功能未知的基因(DUF)组成,其中大部分是松散连接的节点,或属于连接成簇(图6a)。我们发现了12个具有潜在功能特异性的DUF基因,它们集群内部的边缘数较大,但在集群边缘之间却没有(图6b)。所有这些基因都位于紧密相连的集群中(图6c)。这种与已知功能簇的关联允许合理地预测12个DUF基因的功能潜力(图6c)。第2集群中的DUF 1343和DUF 554位于肽酶基因(Peptidase_S41、Peptidase_u32_c和Peptidase M41)和铁蛋白基因(Fer 24和Fer4_10)附近,可能在蛋白质代谢过程中发挥作用(图6c)。同源性模拟结果表明,DUF 1343含有与磷酸核糖基转移酶和Precorrin-6a还原酶同源的结构域,它们在蛋白质代谢中起着重要的作用。在第15集群中,DUF 2969和DUF 436定位在Carboxyl_trans, CTP_transf_like以及Glyco_tranf_2_5附近,这些基因可能与转移酶活性有关(图6c)。第17集群中的DUF 3948与繁殖过程的基因密切相关,如孢子形成的SpoVG基因和孢子萌发的Spore_GerAC基因,这些基因在发育过程中起着潜在的作用。
图6 未知功能编码域(DUF)基因的功能预测。a DUF基因的分布;b 集群内DUF基因的鉴定;c 聚类内DUF基因在全球遗传相关网络中的位置。
评 论
微生物在土壤的生物学特性、生物地球化学过程和生态学功能中发挥至重要的作用,但由于土壤中微生物数量巨大同时具有空间异质性,因此阐述土壤微生物的功能仍具有挑战性。作者通过对中国东部地区45个土壤的宏基因组的基因丰度数据进行了遗传相关网络分析。为了更好地捕捉微生物群落的高功能冗余,减少稀疏数据引起的相关系数的偏差,作者只对少数样本中的非核心基因进行了筛选,并将重点放在核心基因上。通过分析发现每个聚类表示不同的潜在功能,并在不同的功能注释分辨率下观察到具有不同拓扑结构的层次结构。通过通过主网络图分析,对功能未知的基因进行了基于遗传相互作用的功能预测,并通过结构预测进行了验证。这一研究为土壤微生物系统生物学的进一步研究提供了数据支撑。评价仅是小编的个人看法,欢迎大家一起进行讨论。
你可能还喜欢
培训班推荐👇,快来参加,充实自己吧!