科研 | Genome Research: 人类、黑猩猩、倭黑猩猩和猕猴大脑的单细胞分辨率转录组图谱

编译:Nicole,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

与黑猩猩、倭黑猩猩和其他猿类的大脑相比,人的大脑是一个极为复杂的器官,对人类大脑基因表达特征的鉴定可以揭示人类进化潜在的分子机制。本文通过分析代表33个解剖区域的422个人类、黑猩猩、倭黑猩猩和猕猴的大脑样本以及构成其中三个区域的88,047个细胞核,用于鉴定人类基因表达的独特特征。在33个区域中,人的大脑皮层区域、下丘脑以及小脑灰白色物质迅速发展。在细胞水平上,人类进化谱系中星形胶质细胞和少突胶质细胞祖细胞比神经元显示出更多的差异。组织测序和单细胞测序的比较表明,常规RNA测序不能检测到多达三分之二的细胞类型特异性进化差异。

论文ID

原名: Single-cell-resolution transcriptome map of human, chimpanzee, bonobo, and macaque brains

译名: 人类、黑猩猩、倭黑猩猩和猕猴大脑的单细胞分辨率转录组图谱

期刊: Genome Research

IF: 9.944(1区)

发表时间: 2020.5.18

通讯作者: Svante Paabo、Barbara Treutlein9、Philipp Khaitovich

通讯作者单位: 俄罗斯斯科尔科沃科技学院、中国CAS-MPG计算生物学研究所、德国马克斯·普朗克进化人类学研究所、瑞士苏黎世瑞士联邦理工学院、中科院动物进化与遗传前沿交叉卓越创新中心

DOI号: 10.1101/gr.256958.119

实验设计

从包括4名人类、3只黑猩猩、3只倭黑猩猩和3只恒河猕猴的14个个体的大脑中解剖了总共422个脑样本,每个物种至少3个个体,包括涵盖了所有主要的解剖和功能性大脑结构的33个大脑区域解剖样本,使用RNA-seq以上样本。对4种物种的33个脑区中的三个大脑区域(单个扣带回皮层(AC)、尾状核(CN)和小脑灰质(CB))进行单核RNA测序(snRNA-seq)。为了减少物种间的实验差异,将每个物种的个体的组织样本混合处理。在分析差异表达基因后,对3个人、3个黑猩猩和3只猕猴的5个前扣带回皮层样品进行免疫组化分析。

结果

全局基因表达变异分析

使用RNA-seq检测了来自人类、黑猩猩、倭黑猩猩和恒河猕猴的33个大脑区域的RNA表达(图1A、B)。样品之间表达变化的可视化揭示了物种的分离(图1C、D)。个体间差异的消除进一步揭示了每个大脑中33个大脑区域之间差异的共同模式(图1E,F)。这33个大脑区域进一步分为在个人和物种之间共享的7个簇(图1G)。这些簇在很大程度上与解剖学区域相对应,其中3个簇代表皮质区域:主要和次要皮质(I类)、边缘和缔合皮质(II类)、旧皮质(III类),其余4个簇包含皮层下结构:丘脑下丘脑(IV类)、白质结构(V类)、小脑灰质(VI类)和纹状体(VII类)。

在检测到的11176个直系同源蛋白质编码基因中,有2801个显示出大脑区域依赖性物种差异(图1H)。将物种之间的差异分配给进化谱系可以恢复这四个物种之间的系统发生关系(图1I)。与整个系统发育树中的皮层下区域相比,区域依赖性表达差异在3个皮层簇中的积累速度更快(图1J)。

图1. 33个大脑区域的基因表达变异分析。 (A)分析物种之间的系统发育关系。(B)在人脑内对33个分析的脑区域进行解剖定位。颜色表示基于表达的区域簇,定义见图G。(C-F)基于所有422个分析样品之间的表达变化的t-SNE图:总变化(C和D)以及去除平均物种和个体差异后的变化(E和F)。每个圆圈代表一个样本。圆圈颜色表示物种(C和E)或基于表达的区域簇(D和F)。(G)基于4个物种中所有11,176个检测到的基因的平均基因表达值,对大脑区域进行无监督分层聚类。(H)在大脑区域(REG)之间或在对该区域有显著依赖性的物种(REG×SP)之间差异表达的基因数量。(I)基于ANOVA鉴定的表达差异以物种和区域为因子而重建的平均系统发育树。(J)图1G中定义的基于表达的区域簇I-VII分组的33个大脑区域中的每一个的重建系统发育树的总分支长度。

人类特异性基因表达差异的区域分析

在2,801个表达差异基因中,区分人类与非人类灵长类动物(NHP)的差异基因在大脑区域之间的分布不均匀。在簇I和簇II中的新皮层区域高出平均比例,而在小脑白质中发现的差异最大(1,079个基因)(图2A)。

用黑猩猩特异和倭黑猩猩特异的数量对人特异性差异的数量进行归一化,发现了人特异性进化差异非均匀分布。在丘脑和6个白质结构中的4个没有发现过多的人类特异性表达差异(图2B)。相比之下,簇I和簇II中的大多数新皮质区域(72%),以及下丘脑、内囊以及小脑白和灰质,显示出明显超过人类的特异性差异(图2B)。

人类认知功能涉及多个大脑区域,在超过10个大脑区域中检测到的独特人类差异表达基因显示与神经元功能相关的GO富集,包括:突触传递、胞吐作用的调节、神经递质的分泌及其他(图2C)。

图2.人类特异性表达差异基因的区域依赖性分析。 (A)在每个大脑区域显示出人类特异性表达差异基因数量。(B)在每个脑区域中估计的基因表达的人类特异性比率为人类特异性表达差异与黑猩猩特异性或倭黑猩猩特异性表达差异的比率。(C)在33个大脑区域中的10个以上存在的人类特异性表达差异GO富集。

单核转录组分析

为了研究在细胞类型中累积的进化差异,对4种物种的33个脑区中的三个大脑区域(单个扣带回皮层(AC)、尾状核(CN)和小脑灰质(CB))进行单核RNA测序(snRNA-seq)。为了减少物种间的实验差异,将每个物种的一个个体的组织样本汇集起来,并在每个大脑区域中并行处理(图3A)。然后根据物种之间的序列差异,通过计算恢复核物种的同一性。除AC1外,每个库均产生2个独立的snRNA-seq库,从而产生总共88,047个单细胞核:每个区域每个物种7,337±5,548个。其中21%来自AC,29%来自CN,50%来自CB。这些细胞核的总表达变化的可视化显示了3个大脑区域的差异(图3B)。每个物种每个组织内细胞核的平均表达水平与相应的大量RNA-seq数据和已发布的单细胞RNA-seq数据密切相关(图3C)。类似地,相对于黑猩猩特异性或倭黑猩猩特异性的差异基因,人特异性表达差异的程度在平均snRNA-seq和RNA-seq数据之间非常吻合(图3D)。在每个物种的每个区域内,AC和CN中形成6个主要簇,在CB中形成4个簇,每个簇均富含已知的细胞类型标记物(图3E-G)。

图3.3个大脑区域中的单核转录组学。 (A)snRNA-seq实验设计。(B)按大脑区域着色的88,047个单核的t-SNE图。(C)人AC中大量RNA-seq和平均snRNA-seq数据集之间基因表达水平的相关性。(D)AC中大量RNA-seq和平均snRNA-seq数据集之间的人类特异性比率之间的相关性。(E)3个脑区域的每个区域中按物种着色的核的t-SNE图。(F)t-SNE簇的累积细胞类型注释(左)和跨细胞类型标记基因在t-SNE图上平均表达水平的投影。 其中In–抑制性神经元;Ex–兴奋性神经元;Sn–梭形神经元; Pur–浦肯野细胞;OPC–少突胶质细胞祖细胞;Ast–星形胶质细胞;OD–少突胶质细胞;CR–Cajal-Retzius细胞; MG–小胶质细胞;VEC–血管内皮细胞。(G)t-SNE簇细胞类型标记基因的平均表达水平。

基于细胞类型的三3个大脑区域人类表达进化的分析

对人类、黑猩猩和倭黑猩猩谱系中每种细胞类型内表达进化速率的计算显示,在所有分析的细胞类型中没有统计学上的显著增加或减少(图4A、B)。值得注意的是,神经元细胞类型簇表现出更大的异质性,但进化速率却没有增加。

尽管细胞类型之间的进化速率没有实质性差异,但谱系之间速率显示出显著差异(图4C、D)。具体而言,与其他类型的细胞相比,人类特异表达差异基因中神经元簇倾向于表现出比黑猩猩或倭黑猩猩少(图4D)。人特异性表达差异基因在所有检查的大脑区域中星形胶质细胞和少突胶质细胞祖细胞始终显示出最大差异(图4D)。

尽管存在差异,但与两种猿类相比人类进化谱系所有细胞类型中均显示出更高的进化率。因此,进一步测试了人类特异性表达加速是否可以与基因组人类加速区(HARs)相关。在增强子附近的细胞类型中显示人类特异性表达的基因确实与位于HARs中的脑活性顺式调控元件重叠的频率高(248个HAR中有98个,图4E)。此外,数据显示人类特异性表达的42个转录因子(TF)中,有35个在这98个HARs增强子重叠中具有结合位点。此外,在这35个TF中有13个与HARs增强子结合。与snRNA-seq数据相比,基于组织RNA-seq数据集中HARS与人特异性表达的基因之间没有关联。

每种细胞类型的基因表达在整个大脑区域之间具有很好的相关性(图4F)。相比之下,人类特异性表达差异基因在除小脑颗粒细胞之外的神经元亚型之间具有很好的相关性,但在源自不同大脑区域的星形胶质细胞、少突胶质细胞、少突胶质细胞前体或小胶质细胞之间却没有相关性(图4G)。该结果表明,大多数神经元亚型可能共享人类特异性表达差异的特征。支持这一观点的是,神经元亚型中优先表达的基因的人特异性比率在单核和RNA-seq数据集之间呈正相关且显著相关(图5A)。

为了使用RNA-seq数据估算33个脑区每个区域中人类特异性基因差异表达的程度,计算了在RNA-seq数据和神经元亚型中显示人类特异性表达差异的基因之间的重叠(图5B)。与snRNA-seq实验中使用的3个区域相比,7个大脑区域表现出的差异更大(图5B、C)。因此,尽管是间接的,但该结果表明这7个区域可能显示出人类特定的神经元表达变化。

图4.基于细胞类型的3个大脑区域表达演变的分析。(A)系统发育树突出显示了进化速率分析中使用的分支。(B)每个脑区域内细胞类型的进化速率。(C)系统发育树突出显示了人类特异性比率分析中使用的分支。(D)在3个脑区域的每个区域的t-SNE集群内计算的人类特异性比。(E)1,271个基因的增强子相关的重叠,这些基因在snRNA-seq数据中显示人类特异性表达,并位于HARs中的脑活性顺式调控元件上。(F)基于人类簇内的平均基因表达水平,t-SNE簇之间的表达水平相似性。(G)基于与黑猩猩和倭黑猩猩的比较而计算出的t-SNE集群中人类特异性比率估计值的相似性。
图5.使用神经元进化特征对大量人类特异性表达差异进行反卷积。 (A)人类特异性基因的重叠,定义为相对于黑猩猩-猕猴和倭黑猩猩-猕猴之间的差异而言,人类RNA-seq和snRNA-seq数据集之间优先表达的基因差异高两倍。(B)在RNA-seq数据集中每个大脑区域显示人类特异性表达的基因与在snRNA-seq数据中在神经元亚型中显示人类特异性表达的基因重叠的百分比。(C)根据RNA-seq和神经元亚型中人特异性表达差异之间的重叠,将人脑中33个区域解剖定位着色。

snRNA-seq和RNA-seq检测到的基因表达差异

虽然将人类与猿分开的表达差异在RNA-seq和snRNA-seq数据集(包括单个细胞类型)之间具有很好的相关性(图3D),但只有一小部分在两者中均具有显著意义(差异>2倍)(图6)。具体而言,在组织RNA-seq中鉴定出的显著差异基因的13%在snRNA-seq数据集中也显著(图6A、B)。在多种细胞类型中观察到这些差异基因在组织RNA-seq中显示出明显更高的幅度(图6B、C)。因此,普遍存在的差异在组织表达中得到更好的反映。

另一方面,在特定细胞类型中存在的表达差异可能会在组织样品RNA-seq中减弱或消失。使用snRNA-seq鉴定出696个基因在人类与猿类的AC中表达差异,而在组织RNA-seq数据中却无法检测到(图6D、E)。同样,CN中为710个,CB中为289个。平均而言,这些差异达到三分之二以上。

在AC中发现的696种表达差异基因中,25%位于兴奋性神经元中,12.5%位于抑制性神经元中(图6F)。

图6.通过snRNA-seq和组织大量RNA-seq检测到的基因表达差异。 (A)示意图和(B)存在于RNA-seq和snRNA-seq中的表达差异的百分比和细胞类型特异性。 (C)在RNA-seq中在一种(特定)或多种(共享)细胞类型中检测到的表达差异的幅度。(D)示意图、(E)编号和(F)仅通过snRNA-seq检测的表达差异的细胞类型特异性。颜色如图A所示。

免疫组织化学检测到的基因表达差异

使用免疫组织化学(IHC)检测AC中snRNA-seq揭示的表达差异的空间分布。根据snRNA-seq数据选择了2个基因MSI2和NFAT5,在人类星形胶质细胞中表现出较高的表达(图7A)。2种基因均在AC组织切片中产生了清晰而特异性的染色。值得注意的是,虽然MSI2在常规RNA-seq数据中显示了在人AC中的表达增加,但NFAT5却没有显示出增加(图7B)。

与NHPs相比,这两种蛋白在人类星形细胞过程中均显示出明显更高的荧光强度(图7C)。此外,信号位于黑猩猩和猕猴的最上层皮质层,而在人类组织中信号扩散到更深层状结构,包括第二层和第三层(图7D、E)。

图7. IHC检测到的基因表达差异。(A)AC星形胶质细胞中NFAT5 mRNA的平均log10转化表达水平,以及平均值的标准偏差。 (B)log10转化的读数计数。 (C)猕猴、黑猩猩和人类在皮质层和(D)在不同皮质深度的星形细胞过程中NFAT5的IHC信号的平均荧光强度。(E)IHC(上图)及其在AC切片最上层中NFAT5蛋白的二值化表示(下图)。 (F)猕猴、黑猩猩和人类AC上层三层中的NFAT5蛋白的免疫染色(左图)及其二值化表示(右图)。比例尺为100 µm。

讨论

本文结果显示人类特异性表达差异的分布在33个大脑区域中是不均匀的,这些差异将我们与近亲黑猩猩和倭黑猩猩分开。结果表明了涉及新皮层和皮层下区域的人脑表达进化的复杂模式,类似于磁共振成像研究定义的功能网络。

本文在单核水平上对人类特异性表达特征的分析进一步提供了以下见解:

首先,本文检测了每种细胞类型内物种之间的多种表达差异。虽然使用常规的RNA-seq数据检测到这些差异中的大约三分之一,但可以使用特定于细胞类型的方法来揭示其余差异。相反,在组织中检测到的某些表达差异在snRNA-seq数据中未发现,可能是由于人与NHP之间的细胞类型组成改变所致。

第二,与神经元相比,在所有3个被检查的大脑区域中,非神经元细胞类型的人类特异性表达差异明显更大。其中,星形胶质细胞和少突胶质细胞祖细胞表现出最大的人类特异性表达差异。这些人类特异性差异是每个大脑区域所特有的。必须注意的是,本研究覆盖的细胞核数量不足以准确检查特定神经元亚型中表达的演变,因此不排除存在在人类中快速表达进化的特殊神经元群体。此外,将在snRNA-seq数据中检测到的神经元人类特异性表达特征应用于33个大脑区域显示出7个,显示出更大程度的表达差异,包括初级体感皮层、内囊和小脑白质。

星形细胞人类特异性表达差异的区域特异性与成年大脑区域星形胶质细胞的分子和功能异质性的报道相符。类似地,据报道在人尾状核中快速表达进化的少突胶质细胞祖细胞在精神分裂症患者的尾状核中功能异,影响人类的认知。

综上所述,本文结果表明,对大量大脑区域和细胞类型的基因表达进化进行系统有可能揭示人类大脑功能出现的进化模式。进一步对发育中的大脑中表达进化的时间模式的分析,将提高将表达差异与认知功能相关联的能力。

评论

人类具有独有的认知能力,很可能是由基因表达和特定大脑结构中细胞类型组成的改变所介导的,但目前对这些独特的人类进化差异缺乏全面的了解。单细胞RNA测序可以分解大脑区域内的基因表达并比较物种之间的同源细胞类型。在人类和猕猴转单细胞水平录组之间及人类和黑猩猩大脑类器官中单细胞表达的研究中获得了相似的结果,表明基因的同源性及差异表达。本文报道了使用常规RNA测序(RNA-seq)和单核测序(snRNA-seq)构建的人类、黑猩猩、倭黑猩猩和猕猴大脑的转录组图,为进一步研究人类大脑进化及功能提供了重要的数据支持。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐