为更好地帮助到想要利用神经影像做科研的客户们,拓展思影科技的业务范围,思影科技推出脑影像机器学习数据处理业务。
(1)对于原始数据,检查图像是否具有明显的形变、缺损、伪影等;(2)检查图像参数是否合适,如图像维度、体素大小等;(3)对于预处理后的数据,检查所有被试的图像参数是否一致。
二、特征构建
本部分描述可用于后续分类/预测的影像指标及其筛选方式。
2.1特征构建
1. fMRI指标。fMRI(功能磁共振)数据经过时间层校正、头动校正、空间标准化、降噪等预处理步骤后,可计算ALFF(低频振幅)、ReHo(局部一致性)、FC(功能连接)、VMHC(镜像同伦功能连接)等指标。以上指标可以在体素水平计算。
图示.fMRI指标:ReHo(左)与ALFF(右)2. sMRI指标。sMRI(结构磁共振)数据经分割后,可计算灰质体积/密度、白质体积/密度等指标;也可计算皮层厚度、皮层局部回指数等指标。以上指标可以在体素/顶点水平计算。3. dMRI指标。dMRI(弥散磁共振)数据经头动涡流校正、张量拟合等预处理步骤后,可得到FA、MD、AD、RD等指标。以上指标可以在体素水平计算。
图示.弥散影像指标。
4. 灌注成像指标。基于灌注成像数据(如ASL,即动脉自旋标记数据),可以计算脑血流(CBF)等指标。以上指标可以在体素水平计算。5. 脑网络。利用特定的脑图谱(如AAL Atlas),基于fMRI数据,可以构建全脑功能脑网络;基于dMRI数据,可以构建全脑结构脑网络(FA、FN加权)。以上指标非体素水平指标。
图示.功能脑网络示例
6.特征尺度可改变。上述fMRI、sMRI、dMRI、灌注指标,皆可提取特定脑区的数值作为特征。利用特定的脑图谱,可提取每个单独脑区的平均指标值。
图示.提取每个单独脑区的指标作为特征。
7. 行为量表。您自行收集的行为量表得分,也可作为特征纳入后续分析。
8. PET。PET(正电子发射断层显像)数据经过头动校正、空间标准化、平滑等预处理步骤后,可计算SUV(标准摄取值)等指标。以上指标可以在体素水平计算。
注:上述内容包含了常见的脑影像指标,理论上几乎所有影像指标都可以作为特征来使用,如果您有合适的想法,可以联系我们进行协商。上述指标的具体计算,可以参考我们的其他数据处理业务。如果您对脑影像机器学习及相关特征感兴趣,可浏览思影科技相关课程及数据处理服务(目前思影所有课程均开放报名,报名后我们会第一时间联系,并保留已报名学员名额,请添加微信siyingyxf咨询):
北京:
第十七届脑影像机器学习班(北京,9.3-8)
第十九届DTI数据处理班(北京,8.19-24)
第九届小动物磁共振脑影像数据处理班(9.11-16)
第二十三届磁共振脑网络数据处理班(北京,9.17-22)
第二届磁共振脑网络数据处理提高班(北京,9.23-28)
第一届任务态fMRI提高班(北京,8.25-30)
第四十七届磁共振脑影像基础班(北京,10.22-27)
第二十一届脑网络数据处理班(上海,8.20-25)
第三届磁共振脑网络数据处理提高班(上海,10.12-17)
第十届任务态功能磁共振数据处理班(上海,8.12-17)
第十五届磁共振脑影像结构班(上海,9.7-12)
第四届DWI提高班(上海,9.23-28)
第四十五届磁共振脑影像基础班(重庆,8.26-31)
第十八届脑影像机器学习班(重庆,9.12-17)
数据处理业务介绍:
1.相关法。计算每个特征与量表的相关性(如皮尔逊相关),保留相关值高的特征。 2.参数检验法。对不同组别人群的特征做假设检验(比如对两组人群的特征做双样本T检验),保留通过假设检验的特征。3.主成分分析(PCA)法。将所有特征分解成一系列主成分,保留排名靠前的主成分作为特征。4.递归特征消除法。循序渐进地删除影响最小的特征,直至保留特定数目的最重要的特征为止。5. 稀疏特征表示。可以选择使用LASSO回归(及其变种)、低秩(Low-Rank)等特征选择/表示方法。机器学习模型是实现分类/预测的核心所在,我们可以提供神经影像领域最为热门的模型,方便大家选择。这些模型可用来实现MVPA分析,寻找合适的影像生物标记。1.支持向量机(SVM)。在许多情况下,支持向量机都是二分类模型的首选。通过使用核函数,即使基于线性不可分的数据,也可获得较好的分类精度。引入投票机制后,亦可将该模型应用于多分类场景。
图示.支持向量机(SVM)。
2.回归模型。回归模型主要用于预测连续变量(如量表得分)。可选的回归模型有线性回归(GLM)、多项式回归等,也包含其变种,如LASSO回归、岭回归、Elastic Net等。其他可选回归模型有:支持向量回归(SVR)、关联向量回归(RVR)等。
图示.各种回归模型。
3. 集成学习。当单一的分类器性能不良时,可以考虑集成多个弱分类器,形成一个强分类器。可选的集成学习模型有随机森林等。4.神经网络。当没有良好的手工选择的特征时,可以考虑选用深度神经网络(主要基于CNN来实现)模型。该模型可以自动从原始数据中提取特征,用于后续的预测任务。5.聚类。当数据没有标签时,可以选择无监督学习算法,如K-means聚类。6.上述模型的变种。如基于脑连接组的预测模型(CPM),是一种利用脑网络特征和线性/多项式模型进行预测的方法。
图示.基于脑连接组的预测模型(CPM)。
7.多模态融合学习。可以对多种模态的特征kernel进行融合,实现多核SVM学习;也可以使用卷积神经网络融合多模态数据,充分利用各种模态的特征。
如果选择的模型具有超参数,则可以选择进行超参数优化(即“调参”)。为了量化模型的预测效果,需要进行精度评估。参数优化与精度评估皆可通过交叉验证的方式进行。可选的交叉验证方式:S折交叉验证、留一交叉验证、嵌套交叉验证等。
为了验证精度指标是否显著有效(区别于随机猜测),可以打乱数据的标签,重新训练并预测。上述置换检验的过程,可以计算用来验证精度指标结果是否可靠的p值。注:我们可以提供的机器学习模型包括但不限于以上内容。其他模型如K近邻、朴素贝叶斯(Naive Bayes)、线性判别分析(LDA)、主成分分析(PCA)、决策树或上述模型的变种,亦可根据需求实现。您可以选择其中的一种或多种进行尝试。
四、结果汇报&可视化
结果汇报内容包括:
(1)对于分类模型,可汇报敏感性(Sensitivity)、特异性(Specificity)、总精度、ROC曲线下面积(AUC)等精度指标;
(2)对于回归模型,可以汇报相关值、MSE、MAE等精度指标;
(3)置换检验的结果,如p值。
图示.ROC曲线可视化
(3)对于模型训练过程中发现的贡献较大的特征,可绘制点线图、矩阵图、圈状图等等。
图示. 脑网络特征的点线图、矩阵图、圈状图可视化
五、基于最新的机器学习(如深度神经网络)模型,我们还可以对脑肿瘤影像进行影像组学分析。
图示.工程师在讨论
1. 分析方法可定制。思影科技可根据您提供的模板文献,基于您的实验数据,实现文献中使用的数据分析方法。此外,未列出的分析方法,只要在思影科技的能力范围内,尽力实现您的想法。2. 分析代码可定制。您可以选择不同的平台/软件来实现想法。在没有现有的软件适用于您的数据分析需求时,思影科技会与您协商,通过编写代码实现您的想法,并提供代码的完整实现。LibSVM/Scikit-learn.3.可视化方案可定制。如果您有特殊的可视化方案要求,也可与我们协商实现。
欢迎浏览思影的数据处理业务及课程介绍。(请直接点击下文文字即可浏览思影科技所有的课程,欢迎添加微信号siyingyxf或18983979082进行咨询,所有课程均开放报名,报名后我们会第一时间联系,并保留已报名学员名额):
核磁:
北京:
第十九届DTI数据处理班(北京,8.19-24)
第十七届脑影像机器学习班(北京,9.3-8)
第九届小动物磁共振脑影像数据处理班(9.11-16)
第二十三届磁共振脑网络数据处理班(北京,9.17-22)
第二届磁共振脑网络数据处理提高班(北京,9.23-28)
第一届任务态fMRI提高班(北京,8.25-30)
第四十七届磁共振脑影像基础班(北京,10.22-27)
第二十一届脑网络数据处理班(上海,8.20-25)
第三届磁共振脑网络数据处理提高班(上海,10.12-17)
第十届任务态功能磁共振数据处理班(上海,8.12-17)
第十五届磁共振脑影像结构班(上海,9.7-12)
第四届DWI提高班(上海,9.23-28)
第四十五届磁共振脑影像基础班(重庆,8.26-31)
第十八届脑影像机器学习班(重庆,9.12-17)
第十五届近红外脑功能数据处理班(上海,9.13-18)
第二届MNE-Python脑电数据处理班(上海,8.26-31)
第三十二届脑电数据处理中级班(上海,10.20-25)
第十四届近红外脑功能数据处理班(重庆,8.14-19)
第三十一届脑电数据处理中级班(重庆,8.20-25)
北京:
第十届脑电信号数据处理提高班(北京,10.16-21)
第十六届近红外脑功能数据处理班(北京,10.28-11.2)
南京:
第十八届脑电数据处理入门班(南京,9.3-8)
数据处理业务介绍:
思影科技近红外脑功能数据处理服务