【科研简讯】基于几何感知的深度距离变换网络(DDT)及其在管状结构分割中的应用
MICS科研简讯第二十三期
医学图像中的管状结构可提供相关的临床征象,对管状结构的自动分割方法有助于临床的疾病诊断。但由于存在对比度差、噪声大、背景复杂等问题,目前CT图像中管状结构的自动分割仍存在很大的挑战。圆柱形的管状结构可表征为其骨架和对应的横截面半径,因此如何将传统的骨架化距离变换融入到深度学习神经网络是一个值得探讨的问题。今天向大家介绍发表在CVPR2020的一篇研究论文,即基于几何感知的管状结构分割方法(DDT)。
Deep Distance Transform for Tubular Structure Segmentation in CT Scans (CVPR 2020)
1. 问题背景
管状结构可以被表征为一系列骨架点和以骨架点为球心半径不断变化的球体的集合(如图1),为了将这一几何特点融入到管状结构的分割任务中以提高分割准确性,本文提出了一种几何感知的深度距离变换网络DDT。此方法首先通过多任务学习网络,预测了管状结构的分割图和距离图;然后利用距离图重构的形状先验信息细腻化分割图。此外本文还验证了对管状结构如胰腺导管的分割可作为临床肿瘤诊断的一个重要依据。
图1 管状结构的表征图例
2. 方法分析
2.1 管状结构的距离变换
距离变换的定义:对于每个管状结构体素v,其距离变换值是从这个体素v到管状结构表面的最近邻欧几里德距离。
连续距离离散化:如果直接用连续距离值做标签,则需设计一个回归网络,但回归网络相较分类网络难收敛以及不稳定。我们将连续距离通过取整离散化成K类距离尺度即K bins,由此将距离回归问题重新表述为多分类问题。值得一提的是,管状结构的中心骨架上的距离值是对应横截面的半径。
2.2 深度距离变换网络DDT
方法的整体流程如图2所示,分为训练阶段和测试阶段,阐释如下:
在训练阶段,同时用到分割图和分割图的监督信息。对于分割图部分的损失函数,作者采用加权交叉熵损失函数。
其中W为整个网络的参数,
为距离预测分支的权重,
表示位置v被预测为管状结构体素的概率值。
对于距离图部分,首先可以通过器官表面上的点和器官内的体素点的距离计算来得到的距离变换图,对其离散化操作得到的距离图可作为标签,然后使用神经网络对其进行预测。作者设计了一种新的距离损失函数进行监督训练:
其中W为整个网络的参数,
为距离预测分支的权重,
为平衡函数项的权重参数,
为预测体素v属于第k个距离类别的概率。
是标准化权重。
因此在训练阶段网络总的损失函数为
。
在测试阶段,网络两个分支分别可以推理得到分割预测图和距离预测图。本文在测试阶段进行几何感知的精处理[2],即先对分割预测图阈值化得到管状结构的伪骨架图:对于骨架线上的一个位置(一个体素),距离预测图在该位置的值为管状结构在此位置对应的横截面的半径,由此可以生成对应的球体。球体再沿着骨架线进行形状重建,得到几何感知的管状结构的分割结果。
图2 深度距离变换网络的训练和测试流程
3. 实验设计和结果分析
作者使用总共六个数据集对本文提出的方法进行验证,包含了胰腺导管腺、主动脉、静脉和肝血管等器官的数据集。评价指标为平均DSC和平均表面距离。从表1可知DDT的性能均比基线模型要好,说明了方法的有效性。本文只给部分实验案例,更多案例可参考论文正文。
表1 在三种数据集上的管状结构的分割结果比较
此外本文还验证了管状结构可作为临床肿瘤诊断的一个重要依据——以扩张胰腺导管和胰腺肿瘤为例。如图3所示,基于放射科医生提供的临床信息“胰腺导管的头部区域、被截断区域有可能为胰腺肿瘤区域”,在深度学习神经网络无法直接找出肿瘤的情况下,可通过寻找扩张的胰腺导管腺(一种管状结构),来作为辅助肿瘤识别的临床信息帮助检测肿瘤的位置。流程具体为:(1)采用DDT识别并判断是否存在处于扩张状态的胰腺导管。(2)如若存在,则借助导管的信息定位肿瘤候选区域。(3)验证肿瘤是否存在。
图3扩张的胰腺导管腺被肿瘤截断示意图
作者在胰腺肿瘤PDAC数据集上DDT分割一种管状结构,即胰腺导管(Pancreatic Duct),结果表2所示,DDT比3D UNet性能提高了13%。通过在PDAC数据集检测到了通过导管分割间接生成的肿瘤候选区域,可在不降低胰腺肿瘤识别的特异性的前提下提高灵敏性(如表3所示)。
表2 使用DDT分割管状结构Pancreatic Duct
表3 使用DDT分割管状结构,进而检测肿瘤的实验结果
实验表明:(1)DDT能显著提高管状结构的分割性能(如对胰腺导管分割相较于基线模型DSC指标提升13%);(2)DDT可用于分割胰腺导管进而评估肿瘤候选区域,对临床诊断和癌症筛查有重要意义。
参考文献
[1] Wang, Y., Wei, X., Liu, F., Chen, J., Zhou, Y., Shen, W., Fishman E. & Yuille, A. L. (2020). Deep Distance Transform for Tubular Structure Segmentation in CT Scans. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 3833-3842.
[2] Shen, W., Zhao, K., Jiang, Y., Wang, Y., Bai, X., & Yuille, A. (2017). DeepSkeleton: Learning Multi-task Scale-associated Deep Side Outputs for Object Skeleton Extraction in Natural Images. IEEE Transactions on Image Processing, 26(11), pp. 5298-5311.
本文作者:陈杰能,王妍