Kidney Int丨 大数据将怎样影响肾脏研究?
背景
近十年来,科技在大规模分子数据生成和计算机分析领域得到了巨大的发展,随之迎来了“大数据”时代。而“大数据”又为“精准医学”推波助澜,已经帮助提高多种疾病的诊断率、改进风险评估方法和治疗方案。由于种种原因,肾脏病学在大数据分析方面落后于其他领域。本期让我们跟随Kidney International杂志发表的《Big science and big data in nephrology》,了解涉及大数据生成,计算分析的前沿技术和倡议大科学的项目在肾脏病学的应用。(图.1)
图1数据生成和分析技术在肾脏病学领域应用概览
大数据生成的前沿技术
我们将介绍涉及组学数据的基因组学,转录组学,蛋白质组学技术在肾脏病学的应用。(图2)
基因组学
多个基因组学技术(如WES-全外显子组测序,WGS-全基因组测序)可以测量基因组和其变化。它们在肾脏病学的最先应用包括假设驱动的候选基因研究,如血管紧张素原(在结果不可复制的情况下)。基因测序的发展和生物库中大量可用样本使得正在许多患者中进行的全基因组关联研究成为可能,从而对引发多种肾脏疾病的风险因素和发病机制提供了重要见解。目前由于我们解释遗传变异的能力有限不足以解读全基因组测序提供的信息,这也许可以解释基因组测序在临床医学尤其是肾脏学中还没有得到广泛的应用的原因。此外,基因的变化,尤其是那些在非编码区的基因变化,很难从功能上加以描述。因此,基因组测序通常只能在功能和疾病上提供有限的见解。
转录组学
许多在肾脏病学中使用转录组学的研究提高了我们对疾病发生、发展和潜在的生物标志物及治疗方法的认识。其中一项标志性研究是Tuttle et al. 和 Woroniecka et al.分析了95例显微解剖人肾的微阵列样品,观察到肾小管部分的关键酶和脂肪酸氧化调节因子的低表达特性,并证明其在基因上或药理学上保护小鼠免受间质性肾纤维化。尽管临床证据尚缺乏,这项研究表明纠正脂肪酸氧化可能是预防肾纤维化和慢性肾脏病的一种策略。
蛋白质组学
蛋白质组学在肾脏学中的应用包括对活检进行分析,用于更好地描述和重新分类淀粉样变和纤维状肾小球疾病,并获得新的生物标记物。蛋白组学方法也被用于机理研究。例如,来自糖尿病肾病患者肾活检的蛋白质组学揭示了丙酮酸激酶M2的变化,其将可能促进对糖尿病潜在保护信号形成机制的理解。深层蛋白质组学的首次应用包括研究人类和小鼠足细胞的详细特征进而发现FARP1是一种以前未被识别的足细胞特异性蛋白,且它在蛋白尿性肾病中具有的潜在作用。
图2最常见的组学技术和其分子过程的信息。scRNA,-单细胞RNA;SNP-单核苷酸多态性;Transc-转录;WES-全外显子组测序;WGS-全基因组测序。
计算分析技术在肾脏病学的应用
(统计和机器学习)
由于深度学习技术的发展,机器学习近年来取得了令人振奋的进步。
深度学习技术越来越多地应用于生物医学数据方面,包括从图像处理到基因组数据分析。
例如,使用12万张(皮肤病)图像训练机器进行学习后,计算机可以区分良性痣和恶性黑色素瘤,其准确度可以达到一位经验丰富的皮肤科医生水平。类似地,机器学习可能比病理学家通过肾组织活检图像进行纤维化评分的方式效果更好。深度学习也被应用到电子病例中解决诸如电子病例信息的提取、疾病结果的预测和疾病识别。在肾脏病学中,影像学和电子病例的分析可能从机器学习的应用中受益最大。一旦有足够高质量的数据生成,组学数据分析也可能受益。许多深度学习方法已经出现或正处于积极发展中。它们大多是基于人工神经网络,由相互连接的节点(神经元)组成,分层排列,其中一个突出的技术是卷积神经网络,它由多层神经元组成,这些神经元共享参数,只与前一层的少数神经元相连。递归神经网络被设计用来对时序数据(如时间序列)进行建模。虽然深度学习是一项非常强大的技术,但没有一种方法是普遍适用的,特别是在数据稀少的情况下,传统方法比机器学习更有优势。
“肾脏病Big Science”项目
“Big Science”是指通过大型协会的共同合作努力获取大数据进而合作研究实现共同目标。
在肾病学领域,几个大型协会已经联合发起收集人类肾脏组织活检生物数据库的项目进行合作研究。一系列旨在全面描述不同CKD亚型肾脏活检的计划已经启动,包括NEPTUNE(肾病综合征研究网)、ERCB(欧洲肾脏病cDNA数据库)、EURenOmics、C-PROBE(临床表型和资源生物数据库)、PKU-IgAN,以及最近的TRIDENT(用于糖尿病肾病)、CureGN(用于肾小球疾病)和NIDDK(国家糖尿病、消化和肾脏疾病研究所)肾脏精密医学项目(KPMP)。
这些大型的生物库用于获得新见解。例如,通过对人和小鼠肾小球转录组进行分析显示在糖尿病肾病中Jak-STAT通路的激活,研究者从而进行了Ⅱ期临床试验,目的是检验Jak1/Jak2抑制剂baricitinib在患有Ⅱ型糖尿病伴糖尿病肾病的患者中的作用,得到了令人满意的初步结果。
在另一项研究中,通过利用上述ERCB、C-PROBE、NEPTUNE和PKU-IgAN等协会的活检数据库资源,对转录组学数据进行分析,研究人员确定了尿表皮生长因子是慢性肾病的独立风险预测因子。 KPMP计划开始尝试使用肾脏活检的尖端技术来开发分子特征。这项计划类似于10年前开始的肿瘤TCGA协会。计划完成后,KPMP将成为发展精准肾脏病学的主要资源(图4)。
图4关于科学技术和其被纳入肾脏和肿瘤学的基础和转化研究中的时间线。
GWA,全基因组关联研究;KPMP,肾脏精准医学项目;Nat-Gen,自然遗传学;scRNA,单细胞RNA;TCGA,癌症基因组图谱。
结论
在本次综述中,我们了解到有关大数据生成和挖掘分析技术将如何改变肾脏病的诊断过程,预后评估和治疗方案,以及“Big Science”项目对肾脏病学的深远影响。
除此之外,医学成像技术也在快速发展,包括评估肾血管系统的高分辨率超声造影技术,以及高性能计算机断层扫描和高分辨率磁共振成像技术。虽然它们不能取代活检,但是会带给医生在疾病发展过程中肾脏变化的新发现。
通过可穿戴设备对患者进行持续监测而获得的大数据,其涉及的技术在肾病测量如监测糖尿病和心血管相关的身体活动及参数方面极具潜力。一些CKD相关的参数可能很快能为临床所用,这些参数可能能检测患者的患病风险,也可能被用于指导治疗,预后和临床试验.上述技术在发展应用过程中仍面临很多挑战。
就大数据的应用来说,肾脏病领域在研究方面,尤其是在诊断和治疗决策制定方面,远远落后于许多其他领域。但这种滞后也为研究人员提供了在肾脏病学领域大有作为的机会。(图4)
参考文献:
Saez-Rodriguez J , Rinschen M M , Floege, Jürgen, et al. Big science and big data in nephrology[J]. Kidney International, 2019.