【中药资源】两篇海马基因组文章,阐述其形态进化机制及多样化历程
来源:Benagen
海马隶属于脊索动物门、海龙科、海马属,是具有特殊体型的鱼类,广泛分布于世界海洋,被视为海洋生态系统中重要的环境指示物种。因其特殊药用功效而被誉为海洋“人参”,海马因其形态特异,嘴部没有牙齿且呈长管状,全身覆盖硬骨骼,拥有雄性育儿袋和特异的交配行为等,一直受到科学界的高度关注。
该文对中国科学院南海海洋研究所林强研究员团队,于2016年Nature和2021年Nature Communications发表的两篇海马基因组研究高水平论文进行详细解读,主要阐述海马全基因组分析、海马的全球范围内的分布和生物地理模式,以及科学家对海马长期适应性进化特征的深入研究。
研究论文1:海马基因组及其特异体型进化机制
发表期刊:Nature【封面论文】
发表时间:2016.12
2016年12月中国科学院南海海洋研究所、德国康斯坦茨大学和新加坡科技研究局合作完成的研究论文'The seahorse genome and the evolution of its specialized morphology’作为Nature封面故事进行发表。该研究在首次完成海马全基因组分析的基础上,揭示了海马在海洋近岸和岛礁栖息过程中的长期适应性进化特征。
研究背景:
该研究对虎尾海马(Hippocampus comes)进行了全基因组测序和从头组装。比较基因组学分析发现,相比于其他硬骨鱼基因组,海马基因组中蛋白质和核甘酸的进化速率最快。通过基因家族分析,发现了显著扩张且在海马雄性育儿袋中高度表达的基因家族。同时,该研究还发现海马中缺失了参与釉质合成的分泌型钙结合磷蛋白(P/Q-rich SCPP)及调控后肢发育的tbx4基因,这可能就是导致海马没有牙齿和没有腹鳍表型的原因。
主要研究结果:
1.基因组组装、注释及进化分析
该研究使用Illumina HiSeq 2000平台对H. comes基因组进行测序,初步评估得到基因组大小为695 Mb,利用SOAPdenovo组装得到基因组大小为501.6 Mb,contig N50为34.7 kb,scaffold N50为1.8 Mb。基于同源物种线纹海马(lined seahorse, Hippocampus erectus)和转录组进行基因预测,最终得到23,458个基因。其中97%能注释到Swissprot,Trembl和KEGG数据库。通过进化分析发现,共有25个基因家族发生扩张,有54个基因家族发生收缩。预测到转座元件占组装基因组的24.8%。
将H. comes与近缘物种进行聚类,提取单拷贝基因后利用蛋白序列构建进化树,评估得出海马与其他硬骨鱼类发生分化的时间约在103.8 Mya。通过全基因组数据分析得知,海马是目前已获得的全基因组鱼类中,进化速率最快的物种。
2.比较基因组学分析探究海马独特表型成因
进一步分析发现,海马与环境适应相关基因在长期进化过程中发生明显收缩,如嗅觉受体基因(ORs)只有26个,其他鱼类多达60-169个;SCPP蛋白的基因在海马中严重缺失。同时,该研究对海马的非编码调控原件(CNEs)进行整体分析,发现海马的CNE较其它已知鱼类出现严重的缺失现象,通过转基因研究进一步证实了体型相关的Hox基因CNE的缺失对海马体型起到了调控作用。
此外,该研究通过对海马和其他鱼类全基因组比较,发现海马缺失tbx4基因,通过在斑马鱼中对tbx4进行CRISPR/Cas9敲除,发现敲除后斑马鱼腹鳍丢失,而其他体型特征无明显改变,揭示了tbx4基因丢失是海马缺少腹鳍的关键原因。
3.独立进化和复制的pastn基因揭开海马雄性育儿之谜
海龙科的鱼类是目前已知动物中,唯一拥有'雄性育儿’行为的物种。该研究发现H. comes中存在6个pastn基因,在海马育儿袋中高量表达,这些基因属于C6AST亚家族。同时,在雌性生育的剑尾鱼(X. maculatus)中,有6个c6ast基因(属于C6AST亚家族),说明C6AST家族在这两个种系中发生不同程度的扩张,这种扩张造成种系间生育方式的差异。海马的pastn基因拥有“独立进化”的模式;pastn基因在育儿袋的产生及雄性海马孵育过程中展现出新的功能特征,在揭开海马雄性育儿之谜的研究领域取得了重大突破。
本文总结:
该研究完成了海马的全基因组分析,揭示了海马是一种快速进化的物种,同时通过对CNEs调控元件的分析,说明物种不仅可以通过改变基因完成进化,也可以通过调控元件的改变来实现进化,文中作者推测,顺势调控元件,尤其是增强子的缺失或获得,是导致表型发生变化的重要因素。该研究以H. comes基因组为研究基础,进行比较基因组、基因家族分析以及CRISPR/Cas9转化验证等研究,首次阐明了海马特异体型进化机制,并从基因层面探讨了育儿袋形成和孵育过程,揭开了海马雄性育儿之谜。
研究论文2:海马基因组揭示全球分布路线并暗示其进化中的趋同适应
发表期刊:Nature Communications
发表时间:2021.02
研究背景:
海马在全球热带至温带沿海水域有分布。然而,海马对定栖的、隐秘的生活方式表现出许多适应性:它们需要特定的栖息地,如海草、海带或珊瑚礁,海马缺乏腹鳍和尾鳍,没有明显的远洋幼虫阶段,从而导致传统方式的长距离传播效率低下。该研究基于Hippocampus erectus基因组从头组装以及来自21 个物种的 358 个海马样本重测序,研究海马的全球范围内的分布和生物地理模式。
主要研究结果
1.海马的全球多样性
使用PacBio长读长测序(115×),Illumina短读长测序(243×),以及Hi-C技术(184×)对雄性Hippocampus erectus(直立海马)基因组进行从头组装。contig N50为15.5 Mb,(染色体组装结果,基因组总大小为420.66 Mb),与先前使用Illumina测序结果相比(contig N50 = 14.57 kb),序列的连续性有所优化。对21个物种的358个海马样本进行重测序(16×),这些样本反映了海马的全球分布,涵盖了海马主要谱系的代表。该研究通过对4100万个全基因组SNPs分析推断出,每个海马物种都是相邻树中的一个单系组,且物种和染色体之间的遗传多样性差异很大。
系统发育树中,所有现存海马的共同祖先生活在约20-25 Mya。此外,此前研究已确定印度-澳大利亚群岛为海马属的起源中心,随后海马开始发生多样化并在全球传播,其定殖路线和动态与盛行的洋流和板块运动事件密切相关。基于2000个基因座的物种进化树表明,H. abdominalis是包含所有其他海马进化枝的姐妹系,而其他海马被细分到两个主要的进化枝:进化枝I包括仅栖息在印度洋-太平洋的8个物种,而进化枝II包括生活在大西洋的6个物种。对进化枝II深入研究发现,海马依赖洋流作为远距离扩散的一种手段,并展示了临时航道可以促进或限制物种的多样化和扩散。
2.进化枝II的快速多样化和殖民路线
研究发现,由于特提斯海道封闭后,印度洋赤道逆流加强,导致海马群体产生了第二个生物多样性中心,从而进一步促进了海马生物多样性原始中心的高多样性(图c, d)。此外,从较大的平均有效种群规模可以看出,南美洲海马谱系在巴拿马航道关闭前就穿过航道,并在那里繁殖和发展(图a, d)。随后,另一谱系大约在70万年前成功地跨越了南大西洋,并在南美北部海岸和加勒比地区定殖,这一谱系的平均有效种群规模相对较小,分析认为在巴拿马航道关闭后,其无法传播到东太平洋,此外,也可能是因为它的栖息地与其他海马物种重叠,处于竞争劣势(图 d)。
通过基因流分析发现,海马的全球多样化涉及到长距离的扩散,并受到古海道动力学和不断变化的洋流的推动。此外,该研究发现,海水水位和生物群落类型对NeS有复杂的影响,由于分散能力增强(如通过漂流),或冰川提供了区域避难所,一些海马物种可能比其他物种更能抵御海水水位波动或冰川引起的栖息地丧失。
3. 适应性表型的趋同进化
该研究发现,海马的脊椎覆盖程度发生变化,这使它们能够适应不同的生态环境,并且一些谱系暴露在相似的环境压力下,会独立地进化出相似的表型。
为了研究这种不断进化的适应性表型的分子基础,进行正选择分析,研究与非多刺海马相比,多刺海马分支上是否可以检测到加速的非同义/同义突变率(dN/dS)。在海马中鉴定了37个具有加速dN/dS信号的正选择基因,表明多刺表型可能是独立进化的。虽然刺状表型可能有多基因基础,但原位杂交结果显示,在H. erectus刺的早期发育阶段,bmp3表达,该物种的成体阶段没有发育良好的刺(图d)。作为一种转录因子,bmp3被证明负调控哺乳动物的成骨细胞分化(从而影响骨量),提示该基因在多刺海马和非多刺海马之间的不同位点可能会影响其与下游基因的相互调节作用,从而促进具有衍生肽序列的物种的脊柱生长。
本文总结:
海马在渐新世晚期和随后的全球殖民路线中进化,并与洋流和航道开口的动态变化有关。复杂适应性表型(如脊柱表型)的进化分析表明,海马普遍具有较高的进化能力。因此,除了沿着洋流漂流的非正统传播方式外,海马快速适应新环境并对变化做出反应的能力,可能是海马在全球多样化过程中取得成功的原因之一。
参考文献:
1. Lin Q, Fan S, Zhang Y, Xu M, Zhang H, Yang Y, Lee AP, Woltering JM, Ravi V, Gunter HM, Luo W, Gao Z, Lim ZW, Qin G, Schneider RF, Wang X, Xiong P, Li G, Wang K, Min J, Zhang C, Qiu Y, Bai J, He W, Bian C, Zhang X, Shan D, Qu H, Sun Y, Gao Q, Huang L, Shi Q, Meyer A, Venkatesh B. The seahorse genome and the evolution of its specialized morphology. Nature. 2016 Dec 14;540(7633):395-399. doi: 10.1038/nature20595. PMID: 27974754; PMCID: PMC8127814.
2. Li C, Olave M, Hou Y, Qin G, Schneider RF, Gao Z, Tu X, Wang X, Qi F, Nater A, Kautt AF, Wan S, Zhang Y, Liu Y, Zhang H, Zhang B, Zhang H, Qu M, Liu S, Chen Z, Zhong J, Zhang H, Meng L, Wang K, Yin J, Huang L, Venkatesh B, Meyer A, Lu X, Lin Q. Genome sequences reveal global dispersal routes and suggest convergent genetic adaptations in seahorse evolution. Nat Commun. 2021 Feb 17;12(1):1094. doi: 10.1038/s41467-021-21379-x. PMID: 33597547; PMCID: PMC7889852.