科研人员破译中华蟾蜍大型基因组揭示其“成功”的秘诀
中华蟾蜍(Bufo gargarizans)隶属蟾蜍科蟾蜍属,俗名“癞蛤蟆”, 是我国常见且为人熟知的两栖动物。蟾蜍在我国的传统文化中占有重要地位,其也是象征招财进宝的吉祥物。此外,蟾蜍还具有较高的医药研究价值,其耳后腺和背部皮肤的分泌物有较强毒性、成分复杂,主要是强心甾类化合物和生物碱,统称为蟾蜍毒素(Bufotoxin),有麻醉止痛的功效。
蟾蜍科(Bufonidae)物种分布广泛,在除澳大利亚、马达加斯加及南极洲之外的各大洲均有分布。甘蔗蟾蜍(Rhinella marina)在被人为引入澳洲后,迅速入侵土著物种的生境,泛滥成灾,破坏了生态系统。中华蟾蜍在我国分布广泛,从岛屿到高原均有其足迹,其食性广泛,可适应不同的生境,强烈的毒性让一些潜在的捕食者(蛇类等)望而却步。目前,学界尚不清楚蟾蜍广布适应性的遗传机制,通过基因组测序和组装可帮助学界更好地了解该物种。与其他动物相比,两栖动物的基因组破译较困难,这主要是由于其基因组普遍较大,无尾两栖类(anurans)基因组的大小多数范围在2到8 Gb之间、蚓螈(caecilians)多数达~5-10 Gb、蝾螈(salamanders)多数达~20-60 Gb、基因组最大的是一种洞螈(Necturus lewisi),为137 Gb;重复序列占比较高也是造成测序和组装困难的主要原因之一。因此,目前两栖动物的基因组数量较少,且多数组装呈高度片段化、质量不佳。近几年发展成熟的长片段测序技术能够跨过较长的重复区域,结合基因组辅助组装技术,学界有望得到较高质量的两栖类基因组。
为了揭秘中华蟾蜍的适应性遗传机制,中国科学院成都生物研究所吕彬、江建平和傅金钟联合华中师大吴华、河南师大陈晓红、信阳师大宋晓威和西华师大廖文波等高校的科研人员,共同发起了中华蟾蜍基因组测序项目,破译了中华蟾蜍基因组,获得了首个组装到染色体是水平的蟾蜍基因组参考图谱。
该研究利用了4种最新的测序组装技术来构建参考基因组,包括PacBio长读长测序(103X)、BioNano光学图谱(137X)、10x genomeics(130X)和Hi-C染色体构象捕获技术(176X),总计产生了近3 Tb的测序数据量。最终,基因组组装大小约4.55 Gb,仅由747条scaffolds构成(6,822条for热带爪蟾Xenopus tropicalis),Scaffold N50达539.8 Mb,gap占比仅为1.79% ,96%的序列可定位到11条染色体上(图1A和图2A)。比较发现,中华蟾蜍与热带爪蟾的基因组染色体之间具有良好的共线性,研究人员推测至少经历过1次染色体融合和3次分裂事件(图3A)。中华蟾蜍基因组是目前两栖动物中连续性最好的参考基因组(图1B-D),为两栖动物的基因进化和功能以及遗传学研究提供了理论支撑。
蟾蜍基因组中重复序列占比为65.5%,大部分为长末端重复(LTR)序列,这与墨西哥钝口螈(Ambystoma mexicanum)中的发现较近似,其基因组大小约为32 Gb。研究人员推测,LTR反转录转座子的转座复制产生的大量拷贝可能是两栖类基因组巨大的重要原因。基因结构注释和比较发现,越大的基因组拥有较长的基因间区和内含子,外显子长度在不同物种间较保守(图2B)。
研究发现,中华蟾蜍中具有较多的多拷贝基因,在斑马鱼、甘蔗蟾蜍和墨西哥钝口螈中也存在类似的状况。斑马鱼经历了硬骨鱼全基因组加倍事件,基因复制数目在该研究物种中是最多的;而墨西哥钝口螈基因组是迄今完成测序的最大的动物基因组,也发生了较多的基因复制事件;甘蔗蟾蜍和中华蟾蜍隶属蟾蜍科,均是“真蟾蜍”,大多数复制是局部发生的。中华蟾蜍中的基因复制方式以串联(TD)和近端复制(PD)为主,并且TD和PD受到的正选择压力显著高于其他复制方式(图3B和C),研究人员推测这两种复制方式可能与其环境适应性有关。
根据上述推断,研究人员分析了中华蟾蜍基因组中基因家族的扩张状况,发现有122个基因家族发生了显著扩张(图4),化学感受基因家族显著富集,包括嗅觉和苦味受体基因。相比而言,中华蟾蜍的中性替换速率不高,处于中间水平,但其祖先经历了快速的进化过程(图4)。
和其他脊椎动物类似,两栖动物同样拥有数目庞大的嗅觉基因(800~1400 ORs this study),有功能的嗅觉基因占比为60%~70%,众多的基因数目说明嗅觉对两栖动物的生存具有重要意义。中华蟾蜍中共鉴定出1013个嗅觉基因(图5A和B),765个是完整可能有功能的,占比较高(~76%)。就功能和变化趋势而言,蟾蜍感受空气中化学分子的嗅觉基因增多且功能基因比例升高,水中则相反。信息素受体在种内和种间通讯中扮演重要角色,研究人员在蟾蜍中鉴定到5个完整的信息素受体1(V1Rs),但未发现假基因;4个完整的信息素受体2(V2Rs)和33个假基因(图5C)。V1Rs负责检测空气中挥发的小分子,V2Rs则检测水中的。多物种比较倾向支持从水到陆驱动的动态进化假说。
苦味受体能够帮助动物感知食物是否有毒。苦味受体(TAS2Rs)在“真蟾蜍”中发生过3次急剧的扩张(图5D),形成了130多个功能基因,分布在1,4,6,8和11号染色体上。与其他无尾目物种相比,其家族成员数目是最多的,完整基因的比例也是最高的(~80%)。蟾蜍分布广且食性杂,大量的苦味受体有助于提高其毒素检测的能力。此前关于美国白蛾入侵机制的研究(Wu et. al 2019)也发现了苦味受体的显著扩张。
蟾蜍利用毒素进行防御,但其如何避免自中毒是个有意思的话题。研究人员发现,细胞色素P450基因家族中起代谢解毒作用的CYP2C亚家族在“真蟾蜍”中发生了显著扩张(图6A),中华蟾蜍中产生了39个基因,甘蔗蟾蜍中有35个,而其他无尾类只有约一半的成员数。聚类分析发现蟾蜍枝系特异性的CYP2C扩张(图6A),分布在中华蟾蜍5号染色体上一段约3 Mb的区域内(图6B),通过PD(近端)和TD(串联复制)方式形成。这些扩张的家族成员应该在祖先物种中就已形成。
离子通道基因在防止自中毒过程中发挥重要的作用,其中的一个经典案例是:箭毒蛙的烟碱乙酰胆碱受体只发生了1到2个位置的氨基酸替代就进化出毒素耐受性(2017 Tarvin et. al)。研究人员发现,一种烟碱乙酰胆碱受体CHRNE在中华蟾蜍、甘蔗蟾蜍和草莓箭毒蛙基因组中均产生了2个拷贝(图7B),通过串联复制产生,可能和抗生物碱毒性有关;在“真蟾蜍”的钠钾离子泵基因的关键毒素结合区存在一些独有的氨基酸突变(图7A),先前实验证明有的位点突变能够显著鉴定毒素结合敏感性,降低程度甚至能够达到1000倍以上。这些关键区域的氨基酸位点在中华蟾蜍和甘蔗蟾蜍中完全一致,说明受到较强的功能限制。进化分析表明,与其他物种相比,“真蟾蜍” 钠钾离子泵基因的经历了快速的进化并受到正选择压力。此外,研究还发现,6个与牙齿(牙釉质和牙本质)形成相关的基因在“真蟾蜍”祖先中就已丢失(图8),这和无齿的龟、鸟类、须鲸一致,但均是独立丢失的,说明四足动物牙齿形成机制较保守。
相关研究成果以A large genome with chromosome-scale assembly sheds light on the evolutionary success of a true toad (Bufo gargarizans)为题,发表在Molecular Ecology Resources上。研究工作得到国家自然基金、四川省科技厅应用基础重点项目、生态环境部生物多样性调查监测与评价项目等的支持。
图1.(A) Hi-C热图;(B-D)两栖无尾类基因组组装连续性比较
图2.(A)中华蟾蜍基因组全景;(B)不同动物类群基因组的基因区及基因间区长度示意
图3.(A)染色体共线性;(B)5种复制模式统计;(C)中华蟾蜍不同复制模式的选择压力比较
图4.基因家族进化分析。枝颜色代表进化速率,黑框内数字为分化时间,+扩张,-收缩
图5.化学感受基因家族进化。(A)嗅觉受体类型和数量;(B)嗅觉受体不同类型在蟾蜍染色体上的分布;(C)信息素受体的类型;(D)苦味受体的扩张
图6.P450 CYP2C基因家族在真蟾蜍中发生支系特异性的扩张(A)和分布(B)
图7.离子通道基因进化与毒素耐受性。(A-B)钠钾离子泵;(C-D)烟碱乙酰胆碱受体
图8.牙齿发育基因的多次独立丢失