综述 | 哈佛医学院:2型糖尿病的代谢组学和蛋白组学研究
编译:小北,编辑:Emma、江舜尧。
原创微文,欢迎转发转载。
2型糖尿病(T2D)在世界范围持续增加,包括心血管疾病在内的并发症也随之升高,研究代谢组学紊乱与糖尿病发病机制之间的关系是非常必要的。现阶段,高通量技术的进步推动了代谢组学和蛋白组学的发展,这也使得研究人员对T2D循环中生物标记物有了前所未有的了解。这些生物标记物可能是糖尿病筛查、诊断和预后的有效指标。一些代谢和蛋白的标记物作为代谢信号通路的参与者,也参与T2D发展相关的信号通路。多组学策略将代谢组、蛋白组以及基因组整合,为阐释代谢紊乱与T2D之间的因果关联提供了分析方法。尽管这些方法并非没有局限性,然而研究者通过精心的实验设计以及样本处理,使该方法成为T2D研究有力的科学工具。在本文中,研究者对大群体中T2D相关循环代谢学和蛋白组学进行综述,简要介绍了该新兴的研究领域。
论文ID
内容
1. 照顾糖尿病患者面临的挑战
预计到2040年,世界范围将有6.42亿成年人患有糖尿病,且绝大多数的是2型糖尿病(T2D),这种生活方式导致的疾病在全球前所未有的升高,同时也伴随着个体死亡率和致残率的升高,特别是在生产力最高的成年人中。一项包括南美、北非、亚洲南部和东部、中东以及俄罗斯的多国家观察研究发现,约50% T2D个体患有微血管并发症;30% 患有大血管并发症,如冠心病和外周血管疾病;T2D使心血管疾病和死亡的风险升高2-4倍,下肢截肢的风险升高,成为心力衰竭的首要危险因素。反之,心血管疾病导致2/3的T2D个体死亡,最终导致医疗费用升高2-3倍。
糖尿病及其相关并发症的医疗保健费用可通过有效的治疗和处理大大降低。相较于物理疗法,饮食的变化和运动量的增加对于延缓和预防糖尿病更加有效。然而糖尿病发展相关的代谢异常在患者确诊之前数十年就已经开始,这使得风险个体的诊断是非常困难的。此外,不是所有血糖浓度升高的个体都能发展为糖尿病。在过去数十年,美国等国家采用普查的方法提高公众对糖尿病的认知以及规避传统风险因素的意识,包括鼓励多运动减少体重以及减少糖分吸收的健康饮食。流行病学研究将这些方法与体重减少、降低含糖饮料的国家标准相联系。自从1990年美国糖尿病爆发以来,2011年到2017年发病率趋向稳定,并且发病率降低了35%。然而,这些发现并不能证实其中的因果关系。尽管糖尿病患者减少,前期风险个体仍然很多。这些结果提示T2D发展的病理生理学仍然有很多尚不清楚的地方。
同时有证据提示糖尿病临床表现和病程存在显著异质性。Ahllqvist等人通过对临床数据、基因组和预后的数据进行无差别聚类分析,在传统上被认为是T2D的个体中确定了5个新的糖尿病亚群:与类型1糖尿病相似的严重自体免疫糖尿病(6–14%)和严重胰岛素缺乏型糖尿病(9–15%)、发展为慢性肾脏疾病以及冠状动脉风险更高的严重胰岛素耐受型糖尿病(11–17%)、具有轻微代谢紊乱和疾病进程的轻度肥胖相关糖尿病(MOD)(18–23%)和轻度年龄相关性糖尿病(MARD)(34–47%)。这一特异性的分类系统或者普遍适用的临床方法是否影响临床的预后需要进一步研究。
2. 需要新的糖尿病生物标记物
血糖(禁食或者葡萄糖耐受试验后检测)以及糖化血红蛋白(HbA1c)可作为T2D诊断和筛选的生物标记物。生物标记物可以勘探糖尿病进程可能的发展方向、以及并发症的发展,同时能够预测特异治疗后确定预后良好的个体。
如前所述,迫切需要更好的T2D预后生物标记物用于鉴定发展为糖尿病的高危个体,这样医疗资源可以聚焦于疾病的预防。由于个体治疗效果的差异,生物标记物的预测和应答对治疗方案的选择起非常重要的导向作用。预后生物标记物能够鉴定T2D并发症高危的个体,例如ASCVD或者肾脏疾病。
3. 循环的代谢物和蛋白作为潜在的生物标记物
代谢组学的目的是测量细胞、组织、器官以及生物系统的代谢物浓度,系统研究参与代谢的化学过程。同样,蛋白组学的目的是对参与机体生物学过程中的蛋白进行定量和描述这是一个连续的生物化学图谱。在代谢疾病中,代谢产物和蛋白作为生物标记物极具吸引力,在疾病的信号通路中导致代谢物浓度的降低或者积累,可作为疾病出现的信号。从20世纪90年代开始,串联质谱已经应用于对新生代谢物的筛选,对先天错误中积累的代谢中间产物进行测量。这些技术在国家普查中的应用表明,代谢中间物对于临床应用极具敏感性和特异性,并且测量方法既可扩展又非常经济。现在代谢组学已经与外显子组测序结合以确定代谢中先天性错误的新形式,并且与代谢通路中基因突变体相联系。近期欧洲研究者在未成熟类固醇生成中,用气相色谱质谱法测定了尿液代谢物,用以从恶性肿瘤中区分良性肾上腺腺瘤。对这些尿液代谢物的检测同样有助于在重复CT成像时使辐射降低到最少。这说明代谢物可作为预后生物标记,一旦被证实,可能被纳入医疗决策。
T2D是一类多基因代谢疾病,是个体行为和环境因素作用的结果,因此非常适用于代谢组学和蛋白组学研究。多基因组相关研究中的大多数T2D相关基因突变体对糖尿病风险的影响不大。一项包含100万欧洲人的研究发现>300个常见基因突变体仅对16%的糖尿病表型变动有影响,而80个低频突变体仅对1%的表型有影响。这表明包括个体的饮食和物理活动、环境暴露以及人类潜在的微生物群等的非遗传因素,在疾病的发展中也扮演重要的角色。代谢物和蛋白的浓度是基因转录的下游产物,并且受其他因素的影响,两者能够为疾病的联合作用因子提供更加完整的生物学信息。同时,技术的进步使科学家在越来越大的范围快速的绘制循环中的代谢物和蛋白,在表1中简要列举了几个。这加速了人类完整的代谢组和蛋白组图谱的绘制,类似于基因组的进步促进了人类基因组图谱的绘制。
4. 蛋白组学中的分析方法
核磁共振(NMR)光谱和质谱(MS) 通常与气相色谱(GC-MS)或者液相色谱(LCMS)联合应用,是最常见的分析技术。了解不同技术的优势和劣势、以及合适的样本制备方法是有效数据产生所必需的。样本的质量是准确测量分析物的关键。通常来说,生物样本需要在相似的条件下快速收集,并且合理的储存以防止关键代谢物的降解,一些极其易挥发的或者已经氧化的代谢物测量也极具挑战。生物学重复和标准同样需要在分析运行时对仪器校正、对样本的异质性进行调整。
5. NMR光谱
NMR已经应用于不同体液中几种代谢物的同时检测,利用强磁场中原子核可预测的行为确定分子化合物的结构。NMR同样作为一种无损的分析方法,对体内的化合物进行确定,将其与成像技术MRI结合,使生物体代谢物的体内定位成为可能。然而产生的峰图往往是一些不同化合物的整合信号,特别是同类的化合物存在时,这时候就需要复杂的统计分析和软件去解析。同样,当NMR的结果高度可重复性时,从每毫摩尔到每微摩尔对代谢物的鉴定是最有效的。
6. 质谱MS
MS利用色谱分离、分析物电离并且对离子分离质量进行定量、以高分辨率和敏感度鉴定生物样本中的化合物。色谱法不是一个必需的步骤,但是这项技术减少了离子的抑制作用,并且改进MS定量结果的准确性。该方法也适用于对生物代谢物中常出现的同分异构体的鉴定。在色谱中,分析物溶解到流动相,随后与固定相相互作用通过柱子,从而对分析物进行物理分离。利用气相色谱法,分析物被气化进入流动相,并且通过液体层,该方法非常适用于非极性、分子量小且易挥发的分析物。利用液相色谱法,分析物被溶解在液相中并且通过填充有不同化合物涂层珠子的固定相,LC更加适用于极性、热不稳定性的高分子量化合物,并且LC柱子的多样性促进了大光谱范围代谢物的分离。亲水相互作用色谱柱(HILIC)包含亲水性的珠子,能够有效的分离小的极性的分析物,例如氨基酸、核苷酸以及有机酸等,而疏水性的柱子能够有效的分离极性的分子和脂质。
为了测量MS中的分析物,必须将它们进行电离。电喷雾电离(ESI)是最常见的一种方法,利用高电荷针尖加热并且在分析物溶解为液相后进行电离。电离后可以通过不同的分析方法,如TOF、四极子、离子陷阱块以及轨道仪器等对离子进行分离、测量和鉴定。当暴露在预先设定好的电场中时,离子的行为取决于分子量和电荷,并且利用仪器可以确定分析物质量-电荷比(m/z)。TOF仪器利用一个固定的电场加速离子穿过特定的距离,对花费的时间进行测量,具有很高的分辨率和质量精度。四极质谱仪使用振荡电场,以特定的m/z稳定离子的飞行路径,可以作为一个质量过滤器,但是一次性测量分析物的数量有限。离子阱质谱仪在电场中利用一个特定的m/z诱捕离子,与其他离子分离和测量技术相比敏感度更高,但是定量的准确性降低。当离子被困在一个中心纺锤形电极时,轨道阱质谱分析仪能够检测离子振荡的频率,并且提供例外的分辨率和质量准确性。这些不同的分析仪可以在单一方法中耦合以提高分辨率和准确性。
7. 糖尿病中的代谢组学
在过去几十年,越来越多的文献报道描述了与T2D相关的代谢图谱。测量已知化合物特定群组的靶向方法,以及测量所有未被注释过化合物的非靶向方法已经开始应用。选择性研究说明了这些技术的详细应用如下(表1)。
表1 代谢组学与蛋白组学技术循环生物标志物的发现比较
8. 氨基酸
代谢组学研究中,糖尿病和血糖特性之间的关联主要表现为与支链氨基酸 (BCAAs)—如亮氨酸,异亮氨酸和缬氨酸正相关。氨基酸代谢和胰岛素耐受、人类肥胖之间的关系在十几年前已经被发现。Newgard等人通过对肥胖和消瘦个体进行横断面代谢组学分析证实了这些关联。BCAAs在肥胖个体中的比例更高,即便在肥胖校正后仍表现为较高的胰岛素耐受。随后Wang等人在一项前瞻性分析中证实,FHS中BCAA浓度最高四分数的个体发展为糖尿病几率增加了2至3.5倍。在校正临床风险因子包括体重指数(BMI)后,关联仍然存在,并且在其他矩阵中重复。越来越多的实验证据提示,饮食增多或者代谢缺陷导致BCAAs升高可能,进而活化了哺乳动物靶基因雷帕霉素(mTOR)激酶活性,解除了胰岛素信号通路或者细胞毒性代谢物的积累反向影响了胰腺胰岛β细胞或者脂肪细胞。
然而,BCAAs与糖尿病是否存在因果联系,或者这些联系是否是由反向因果关系或混杂因素如肥胖造成的尚不清楚。随着人类基因组工作的完成这些问题开始得以澄清。Lotta等人在16 596个个体中完成了BCAA的全基因组相关联分析(GWAS),确定了一些高表达的单核苷酸多态性,在欧洲人群47 877个案例以及267 694个对照中发现,一些单核苷酸多态性可能增加了患糖尿病的风险。在一个较小的队列中利用孟德尔随机分析发现,胰岛素耐受与BCAA水平存在单向因果关联。这些结果提示BCAAs的升高是肥胖和胰岛素耐受的下游效应,能够短暂的加速临床糖尿病的发展,或许在某种程度上介导疾病的发展。
有研究发现一些芳香族氨基酸与糖尿病的发展正相关,包括酪氨酸和苯丙氨酸。溶液中芳香族氨基酸与BCAA能够通过mTOR信号通路改变细胞内胰岛素信号通路,并且与BCAA竞争性结合细胞内转运体,但是芳香族氨基酸导致糖尿病或者胰岛素耐受的研究有限。谷氨酸和谷氨酰胺是氮和碳循环的中心,两者与BCAA代谢相关,在一些队列中与糖尿病的发展相关。谷氨酸在柠檬酸循环合成α-酮戊二酸中生成,是抗氧化型谷胱甘肽生成的中间物,已经有报道称其与糖尿病正相关。谷氨酰胺是谷氨酸转氨的产物,其与糖尿病的发展负相关。由丝氨酸合成的甘氨酸也与T2D的发展以及受损的葡萄糖耐受负相关。这些代谢物在糖尿病发展中的作用尚未清楚,然而,在一些细胞内代谢信号通路中发挥主要作用,可能通过与NMDA谷氨酸受体相互作用,调节β细胞胰岛素的分泌,如与糖尿病发病率负相关的丝氨酸。
研究者在FHS马尔默饮食和癌症的研究中发现,赖氨酸降解产物2-氨基己二酸同样与糖尿病的高风险相关,具有最高四分位数浓度的个体在12年后发展为糖尿病的风险提高了4倍。这与肥胖小鼠、高胰岛素血症小鼠以及糖尿病大鼠中2-氨基己二酸的浓度升高一致。同样,将小鼠和人类胰岛细胞暴露在2-氨基己二酸中发现胰岛素的分泌增加,但是在胰岛素耐受之前2-氨基己二酸的浓度是否升高以及后期是否在补偿机制中发挥作用尚不清楚。
9. 有机酸
α-羟丁酸是α-酮二醇氨基酸代谢的产物,参与谷胱甘肽生成的信号通路,与糖尿病的发生正相关。在没有糖尿病个体的群组中,α-羟丁酸与胰岛素的敏感性负相关。乙酰乙酸酯是一种脂肪酸FAs合成的酮体,当葡萄糖水平低时可作为一种能量补给资源。研究者在一项芬兰人男士以及巴伐利亚人研究中发现,乙酰乙酸酯与糖尿病的患病风险正相关。α酮酸,特别是支链-酮酸在BCAA分解代谢第一个不可逆步骤中形成。
10. 胆汁酸
研究者在一项欧洲人的研究中利用非靶向方法发现,3种胆汁酸例如脱氧胆酸、胆汁和甘氨脱氧胆酸在年龄和性别校正过的模型中与疾病正相关。对临床风险因子进行额外校正后只有脱氧胆酸显著。该项研究也证实在与脱氧胆酸水平相关的CYP7A1编码区域单核苷酸的多态性与T2D相关。基因组的发现并不是一个常规的孟德尔随机分析结果,因而不能证实因果关系,但是说明循环中的胆汁酸以受体介导和非受体介导的机制影响血糖症。
11. 碳水化合物
己糖——通常作为6碳单糖,如葡萄糖和果糖的多样异构体成分被检测,是糖尿病发生中代谢研究最常分析的碳水化合物。在葡萄糖临床测定校正后,这些成分仍然与疾病的发病正相关。这反映了检测样本中己糖的分析技术高度灵敏,而在临床葡萄糖分析中并不能检测到。循环中海藻糖是一种从人类饮食中获取的非内源性的糖,与糖尿病正相关。利用非靶向的方法,研究者发现一种甘露醇和一些脱氧己糖,与糖尿病的风险负相关。
12. 脂质和酰基肉碱
脂类是细胞能量稳态的重要组成部分,可作为代谢底物、信号激素或者细胞膜构建模块发挥多样的作用。临床检测中脂质特别是大量甘油三酯的升高,在传统意义上被认为是T2D的高危表征。在20世纪60年代,Randle等人对氧化循环中FAs和葡萄糖之间的竞争关系进行了描述,并且提出:过多FA的氧化导致葡萄糖内稳态受损以及胰岛素耐受。细胞内FA氧化产物的积累,例如甘油二酯、甘油三酯以及神经酰胺也与胰岛素耐受相关联。
临床上对脂质传统的测量方法通常缺乏特异性,但是结合气相色谱以及LC-MS技术,特异的脂质可通过整体的乙酰链碳原子数目以及双碳含量进行鉴定。在FHS中,具有较高水平甘油三酯、较短乙酰碳原子链以及很少双碳含量的个体,即使在临床风险因子校正后糖尿病发展的风险也升高。胆固醇酯和特定的磷脂,例如LPCs、PCs以及溶血磷脂酰乙醇胺中也观察到了相似的趋势。研究者在对芬兰男士的研究中发现,单一不饱和的FAs与整体FAs的比值同未来T2D风险的升高相关。饱和的n-7以及n-9的FAs与整体FAs的比率以及甘油、整体的FAs、整体的甘油三酯的水平也被发现与T2D的风险正相关,而二十二碳六烯酸的比率、omega-3 FA、亚油酸以及n-6 FA与整体的FAs负相关。研究者在对芬兰男士的METSIM研究中发现,APOA1与HDL的比值是未来T2D风险影响最强的指示。在近期对年轻芬兰人的研究中,研究者通过对脂蛋白的脂质亚组分进行测量发现,在大的LDL颗粒中胆固醇的浓度与T2D风险正相关,而HDL,特别是非酯化胆固醇的浓度与T2D风险负相关。在所有脂蛋白亚类中甘油三酯含量与T2D风险正相关。
Wang-Sattler等人在多个群体中发现,C18:2 LPS、甘油与受损的葡萄糖耐受以及T2D的发生负相关。在一项单独的分析中研究者发现特异的二酰基磷脂酰胆酰(C32:1, C36:1, C38:3, 以及C40:5)与T2D风险正相关。研究者证实C18:2 LPC呈现负相关,并且发现C16:1鞘磷脂以及特异的酰基-烷基-磷脂酰胆碱或者缩醛磷脂PCs(C34:3, C40:6, C42:5, C44:4, 以及C44:5)与T2D风险负相关。进一步非靶向的研究也证实特异的LPCs和PCs与T2D之间负相关,而在美国印第安人小群体的研究中发现磷脂亚油酰基-甘油磷酰胆碱与糖尿病负相关。
细胞内β-氧化将FAs转运至线粒体由酰基肉碱的形成促成,特别是中等长度的酰基肉碱。BCAA分解代谢也能导致特异的酰基肉碱形成。Newgard等人发现BCAA分解代谢的产物C3和C5酰基肉碱的升高与胰岛素耐受非常相关。C2酰基肉碱与KORA中糖尿病的发生正相关。
13. 外源性代谢物
值得注意的是,循环中的代谢物不仅仅由内源性细胞和组织代谢产生,也可来自于饮食或者外源性物质——外来的化学物质通过食物防腐剂或者容器、环境暴露以及人类微生物群产生。随着高通量技术检测到的代谢物数量越来越多,外源性代谢物资源在T2D发育过程扮演的角色也凸显的愈发重要。研究者在ARIC研究中发现,食物中添加的赤藓醇与常见临床风险因子校正后糖尿病的发生显著相关。环境中干扰内分泌的化学物质,例如杀虫剂的代谢物,包括多氯联苯、氧氯丹、反式壬氯酚或者p,p’-DDE已经在人类血清和尿液中利用GC-MS进行测量。人类群体研究发现,这些持久存在在机体内的污染物与糖尿病的发生相关。
微生物群体是另一潜在的生物活性代谢物资源,通常与饮食成分相关。研究者在芬兰糖尿病预防研究中利用非靶向LC-MS绘制血清代谢图谱,结果发现微生物群体代谢物吲哚丙酸、酪氨酸的浓度与T2D的发展负相关,而与整体的纤维和谷物摄入正相关。在饮食干预相关的高通量代谢图谱,如PREDIMED图谱中,研究者发现与饮食相关的代谢特征与心血管和代谢的良好预后相关。这些发现说明外源的代谢物对代谢疾病发挥重要的作用,并且参与研究领域的快速发展。
14. 蛋白组学
蛋白质作为基因转录和转录后修饰的最终产物,在疾病的分子机制研究中也发挥了至关重要的作用。亲和分析利用单一或者多克隆抗体的亲和性与受体连接,该技术已经应用于探究脂联素、瘦素、性激素结合球蛋白以及维生素E结合蛋白、阿法敏与T2D风险之间的关联。抗体的特异性使得定量结果精密准确。然而,这些实验只针对一种分析物,不能对样本中出现的所有蛋白进行无差别的测量。同样,除了球蛋白,大多数血清中的蛋白是低丰度的,通常低于大多数免疫试验检测的局限值。该项技术可应用于靶向研究,利用同位素标记合成的肽段鉴定高特异性的蛋白,同时也可应用于无差别的或者非靶向研究,类似于鉴定Whitehall- II群体中与T2D发生相关蛋白的方法,在一个时间点对一些低丰度的分析物进行无差别的测量。这是一个消耗人力和时间的紧密过程,首先研究人员需要去除高丰度的血浆蛋白,通过凝胶电泳或者液相色谱对蛋白进行物理分离,并且在MS之前进行胰蛋白酶消化,随后利用免疫方法或者其他的程序对鉴定的蛋白进行证实。
近期蛋白图谱技术的发展使循环中蛋白检测的效率和数量提高。利用多复合的抗体或者新的亲和试剂能够提高所定量蛋白的数量。目前常应用的两种高通量技术包括核酸亲和试剂以及核酸标记的抗体。SomaLogic平台应用的核酸适体,可以利用寡核苷酸实现多样的结构,已经应用于结合靶蛋白的表位,提高蛋白的检测和定量。Olink平台应用的核酸标记抗体,可以利用聚合酶链反应(PCR)技术对蛋白进行扩增、检测和定量。互补的DNA寡核苷酸序列具有自然退火的倾向,可作为PCR模板进行PEAs。核酸适配体或者核酸标记抗体结合的特异性是这些技术最大的局限性之一。研究人员利用传统的免疫试验初步证实蛋白鉴定的特异性,随后整合MS和基因组数据加以辅证。图1阐释了这些方法的工作流程,Smith等人发表的review中有更加详细的描述。与代谢组学相似,研究者需要认真考虑研究设计、样本收集、制备以及方法的筛选。同样,生物标本需要在相似的条件下收集,因而研究人员需要考虑样本收集储存管的类型并且进行合适的储存以防止关键蛋白的降解。最终,鉴定所用抗体或者适配体的特异性可以考虑用MS或者免疫测定的方法进行证实。
在一项瑞典人研究中,研究者利用核酸标记的抗体和PEA实验鉴定出了7个循环蛋白,与评估胰岛素耐受的体内稳态模型相关,包括与组织蛋白酶D建立起来的新的关联,以及之前报道的蛋白瘦素、肾素、IL-1ra、肝细胞生长因子FABP4以及tPA。其中,IL-1ra和tPA与糖尿病的发生呈正相关,然而,这些关联在禁食葡萄糖校正后完全减弱。孟德尔随机分析也提示胰岛素耐受对tPA抗原的水平影响不大。在近期一个更大的代表性研究中,研究者发现29个蛋白与糖尿病的流行相关,FDR<5%,其中14个是新发现的关联。然而,没有一个在孟德尔随机分析中与糖尿病存在因果关联。MS蛋白组学结合二维凝胶电泳对血糖正常瘦削、血糖正常腹部肥胖、前驱糖尿病以及糖尿病的韩国人进行分析,结果发现在腹部肥胖或者胰岛素耐受个体中AAT/ SERPINA1、HP、ZAG、APOA1以及RBP4的水平更高,而GIG25/AACT/SERPINA3、ALB、TTR的水平更低。
图1 不同高通量蛋白质组学技术的工作流程m/ z表示质荷比, qPCR为定量聚合酶链反应
15. 与心血管疾病之间的关联
代谢组学和蛋白组学也被应用于研究心血管疾病的生物标记物,与一些常见的代谢信号通路包括胰岛素耐受、T2D以及心血管疾病等一致。例如,BCAA-以及BCAA-相关的代谢物与冠状动脉疾病正相关。谷氨酸/谷氨酰胺和一些酰基肉碱的水平也能够区分冠状动脉疾病个体和对照组,甚至在校正传统临床因素之后鉴定体重指数和糖尿病之间的关联。特异的LPC和鞘磷脂与冠状动脉疾病的发生相关,而LPC包含不饱和FAs的LPC缩醛磷脂,以及包含甘油二酯、鞘磷脂以及神经酰胺的PCs水平升高,而LPC和包含饱和FAs的LPC缩醛磷脂的水平降低,与冠状动脉疾病的流行增多相关。研究者在对旧金山湾区患有冠心病的美国人进行研究,结果发现200个与心血管疾病相关的蛋白,包括一些与T2D相关的家族。这些结果说明代谢信号通路的重要性,可能应用于解开T2D相关心血管疾病的机制。
16. 未来的方向
如上述,代谢组学和蛋白组学能够提供疾病状态下被扰乱的化学和蛋白浓度信息。由于代谢物和蛋白是代谢信号通路中的成员,它们也能够提供洞悉造成心血管代谢疾病的分子信号通路。然而近期的挑战是如何将这些信息整合到信号通路中并进一步探究。研究者可利用基因组的数据识别导致疾病的生物标记物。代谢组学和蛋白组学中的非靶向图谱可应用于鉴定新的小分子、酶或者转运体。在干预实验中这些方法的利用逐步增多,这也将揭开辨识治疗效果、反应以及毒性的潜在生物标记物。
17. 遗传因素对循环中代谢物和蛋白浓度的影响
循环中的代谢物或者蛋白在个体间的多变性可能归因于遗传因素。研究者最初应用孪生子研究血液中特异因子的循环浓度,并且利用GWAS数据估算代谢物的遗传可能。一个SNP能够解释高达16–36%的代谢物变异。代谢物和蛋白同时受多个基因的影响。基因的遗传性提示在氨基酸和小分子水平,23–55%的可变性是基因导致的,在脂质和脂蛋白中的比例更高,高达48–76%。虽然基因的影响是巨大的,仍然有一部分无法用遗传学来解释。在Framingham后代群体的GWAS研究中,研究者发现,34%的血浆代谢物受遗传因素影响。一些非遗传的因素可能是熟知的临床或者环境因素,但是尚未证实。
遗传因素同样影响循环中蛋白的浓度,在一项欧洲人INTERVAL的GWAS分析中,研究者发现遗传突变可解释高于20%的突变,尽管只有≈10%的蛋白被检测到。在Framingham后代群体研究中研究者发现了更高的比例≈90%,但检测到的蛋白显著更少,遗传性的平均值仅占49%,提示一部分循环蛋白的突变无法用遗传因素解释,需要进一步研究。
18. 生物标记物与基因组学整合可以发现与疾病相关的原因
如上所述,几百个的代谢物和蛋白与糖尿病相关。然而,对生物标记物研究的局限性使得因果关系很难建立,为此需要花费时间和资源在细胞系和模型器官系统中进行机制研究。越来越多基因组数据的开放以及统计学方法的进步,促使鉴定生物标记物是否是导致疾病的原因成为可能,并且有助于对特异的生物标记物优先进行进一步的机制研究。
工具变量分析方法利用孟德尔随机取样或者基因的随机遗传,得出遗传变异和中间表型的因果推论。例如随机对照试验中,研究者将参与LDL受体降解的蛋白PCSK-9抑制后,发现LDL的水平成功降低、主要心血管事件的风险也降低。此外,Ference等人在超过110000个体的群体中,利用孟德尔随机取样发现PCSK-9功能缺失的基因突变与较低的临床LDL低密度脂蛋白胆固醇的水平相关。这些相同的突变也与低风险的心血管疾病相关。这一结果提示心血管风险的降低与这些特异的PCSK-9突变体对LDL水平的调节相关。有趣的是,这项研究也发现这些与LDL水平降低效应相关的同一基因突变,也与禁食血糖受损个体的T2D风险升高相关。在临床应用中,他汀类药物是另一类降低LDL胆固醇的药物,其与一小部T2D风险升高相关。利用这一框架,暴露在高水平或者低水平生物标记物中可以替换中间的表型,以探究生物标记物是否存在于疾病相关的信号通路中。
19. 新的非靶向小分子的发现
靶向代谢组学和蛋白组学的平台对分析物高度富集,但是研究人员需要已知分析物参与的代谢过程,例如柠檬酸循环、糖原异生以及糖酵解。因而大多数与糖尿病相关的代谢产物和蛋白生物标记物,也与血糖代谢异常有很强的相关性。从生物学的角度来看,这是合乎逻辑的,但是限制了禁食后血糖水平或者血红蛋白HbA1c水平对预测和诊断的价值。Wang等人在传统的心血管疾病风险模型中逐步添加100个假设的生物标志物进行研究就证实了这一点(图2)。在临床模型中生物标记物或者预测因子之间的相关程度,关乎每个生物标记物提供的信息以及需要多少生物标记物能够有意义的改变风险模型的预测能力。130种对代谢组学和蛋白组学非靶向的分析方法能够对新的小分子质谱峰图进行无差别的鉴定和定量,这些新的小分子之前尚未报道过并且可能参与完全分离的信号通路,与已知的临床风险因子例如血糖异常和肥胖弱相关。
近期研究者利用非靶向与基因组整合的方法对二甲基胍基戊酸(DMGV)进行鉴定,DMVG是一种新的成分,与非酒精脂肪肝(NAFLD)相关。虽然与肥胖密切相关的DMGV不能作为诊断的生物标记物,它却提供了物理活动、体重和心血管代谢疾病之间潜在的代谢关联。利用孟德尔随机化,研究者将有可能证实DMGV存在于肥胖或者胰岛素耐受相关的信号通路中,如果是这样的话,还可以进一步研究疾病的机制。总之,DMGV说明潜在的非靶向方法有助于科学假说的产生,并且进一步理解代谢疾病与行为和治疗之间复杂的相互作用。
图2 基于模拟假想生物标记,1-SD预测的危险比增加一个变量,可以逐步改进对假设生物标志物的识别
20. 不同生物标记物的治疗效果
本综述中大多数研究聚焦于评估群体中T2D与血糖特征的相关性。这些技术也可用于探究治疗效果。个人对T2D治疗和预防的应答显著不同,机体参与药物代谢的酶基因突变以及临床因子的差异是部分原因。在糖尿病预防项目中,代谢组学说明特异代谢物的基线浓度与生活方式改变以及二甲双胍对T2D预防效应的差异相关。代谢物包括甜菜碱的改变是由于物理活动和饮食的改变,精氨酸和精氨酸代谢物仅仅是由于饮食的改变,这些干预使T2D发展的风险降低。蛋白组学方面,Williams等人对9个心血管蛋白风险评分证明可以预测Torcetrapib的治疗效果,该药是临床试验中发现的一种新型胆固醇药物,与心血管事件的升高相关,也与临床治疗起始3个月内心血管不良反应相关。总之,这些发现说明代谢组学和蛋白组学的生物标记物在治疗预后以及明确治疗机制中发挥重要作用。
结论
代谢组学和蛋白组学是研究T2D生物标记物的有力工具。代谢组学、基因组学以及其他组学的数据整合有助于阐释疾病发展相关的信号通路,并且随机对照试验中的图谱将提供有关治疗效果或反应的信息。与心血管疾病重叠的分析结果也证实T2D相关心血管疾病的并发率升高。研究者需要特别考虑技术的选择、研究的设计、样本的制备和数据的分析,以获取有用的结果。在未来,非靶向的方法能够大幅度扩展循环中的生物标记物,而在治疗试验中这些技术的应用也能帮助鉴定个体对治疗应答的标记物。这些技术可以进一步用于临床治疗以及对T2D发病机制的科学理解。