CT图像是医生诊断肺部病灶的首要依据.目前, 大部分针对CT图像的计算机辅助检测(CAD)方法均基于2D特征; 但由于肺部的支气管、血管等组织与肺结节的2D特征相似, 对检测产生干扰, 所以基于2D特征的检测效果并不理想[1-3], 而将3D特征应用于肺结节检测已经成为胸部CT图像研究的主流.目前有许多已发表的与肺结节3D特征相关的文献[4-5].本文针对肺结节在3D空间具有中心点连续性的特点, 在分割肺部区域及疑似肺结节区域的基础上, 计算疑似肺结节区域的质量中心点, 并评价其偏移程度, 最终确定该区域是否为阳性肺结节.本文在实验中使用的CT图像均来自上海市胸科医院和LIDC数据库.
1 基于2D特征的疑似肺结节检测3D特征分析需要处理相邻的多张图像, 其时间复杂度为O(m·n), m表示图像数量, n表示肺结节数量[6].为了降低计算量, 有时需要利用肺结节的2D特征确定疑似肺结节区域.
1.1 超像素相似度计算本文使用基于简单线性迭代聚类(simple linear iterative clustering, SLIC) [7]方法对CT图像分割超像素, 见图 1.
超像素在分割之后按照式(1)归一化:
(1) |
式中:sp_value(i)为超像素i的像素值; N(i)为超像素i包含像素的数量; I(i)(x, y)为超像素i中位于(x, y)处像素点的像素值; Nsp_total为超像素的数量.
超像素i和j之间的相似度定义为
(2) |
将超像素i和j之间的拓扑关系与式(2)结合, 得到相似度的定义如下:
(3) |
式中:neighbor(i, j)=true表示超像素i和j相邻, neighbor(i, j)=false表示超像素i和j不相邻.
1.2 基于超像素相似度合并的肺分割通常相邻超像素在空间和颜色方面具有一定的相似性, 合并相似超像素能够突出CT图像中的感兴趣区域.相似的像素点合并, 而差异较大的则会分裂, 超像素的合并与分裂由边界线上的像素点控制.经过多次迭代合并就会提取出肺部区域, 提取的结果如图 2所示.
由于肺部轮廓提取时仅考虑超像素的相似度, 最终得到的轮廓可能是非连接或者弱连接的.为了解决这个问题, 合并超像素时需要利用边界能量, 这样可以强化存在连接的图像轮廓.把相邻超像素分界线上所有点的平均分割能量作为对应超像素之间的分割能量, 并按照这样的规则合并所有的超像素.随着合并的进行, 能量值低的分割线逐渐淡化, 能量值高的分割线逐渐突出, 最终可以形成连续的图像轮廓.
分割能量的计算公式为
(4) |
(5) |
式中:energy(i, j)是两个超像素区域i和j之间的分界线能量; N(i, j)是超像素i和j的分界线像素点总数.En(i, j)的定义如式(5)所示, 表示超像素i和j分界线上的第n个像素点的分割能量, 其中I(x, y)表示位置在(x, y)处的像素点的像素值; (x, y)n表示像素点(x, y)包含于超像素分界线上第n个像素点的邻域.超像素之间分离线的分割能量更新过程如式(6):
(6) |
式中:区域j′为区域i和区域j合并后新产生的区域; energy(k, j′)为区域k和区域j′之间的分割能量.反复迭代此合并过程直到所有超像素边界的分割能量都大于设定阈值, 则会得到完整分割区域.图 3a为上述过程的分割结果, 生成的分割轮廓既连接又简单.图 3b为最终的肺分割结果.
将分割出的肺部CT图像分解成超像素, 能够将疑似肺结节区域与正常器官划分到不同的超像素中, 这可以使疑似肺结节检测更具有针对性.此外, 基于SLIC的超像素分割算法时间复杂度较小, 且能控制超像素的数量和边缘贴合程度, 因此本节仍然使用该方法分割疑似肺结节.
图 4a为SLIC超像素合并的结果, 亮度较高区域为疑似肺结节部分.图 4b为最终的提取结果, 图中红色边框区域为疑似肺结节区域.通过图 4b可以发现, 很多正常肺部组织也包含在疑似肺结节区域中, 这些区域需要通过进一步处理来排除.
在CT图像中, 肺结节的2D特征主要包含边缘形态和边缘周长.在单一CT图像切片中, 血管和气管等肺组织可能出现与肺结节相似的特点, 对检测产生干扰.而在3D空间中, 肺结节的形状与球体接近, 血管和气管等组织呈现延伸形态, 两者特点明显不同.所以利用3D特征区分肺结节与肺部组织的可靠性更高.
首先, 不同大小的肺结节跨越的CT图像帧数也不同.例如, 如果肺结节直径为3 mm, CT扫描距离2.5 mm, 则该肺结节的连续帧数则不应超过2.为了评价这种连续性, 本文使用连续性系数(continuity_pos)表示肺结节的单向连续帧数.continuity_pos的计算方法如式(7)所示:
(7) |
式中:continuity_pos表示包含同一个肺结节的单侧邻域范围;size表示疑似肺结节区域包含的像素点数.size的计算方法如式(8)和式(9)所示:
(8) |
(9) |
式中:m和n分别为第k个超像素区域的行数和列数; B(k)(i, j)为第k个超像素的二值化区域中位于(i, j)处像素点的像素值.
在3D空间中, 中心点连续性是判断物体形态的重要指标.球体(如肺结节)的中心点在连续多帧的图像中保持不变, 而形状不规则的物体(如血管或支气管)中心点通常变化较大.此外, 计算中心点连续性的时间复杂度较低.
图 5展示了肺结节与支气管在中心点连续性上的差异.图 5为连续4张CT图像, 顺序为胸部内由下到上.图中的红色边框区域为支气管截面图像, 这些区域在2D空间中判定为疑似肺结节区域.通过位置的变化可以看出, 红色边框的分布从分散到聚合, 表现为空间延伸的树形结构[8].图 5中的绿色边框区域为肺结节截面图像, 在4个子图中始终保持中心点位置一致, 与红色边框的特点明显不同[9].本文利用质量中心点连续性描述这种差异.质量中心点(Cx, Cy)表示疑似肺结节CT截面的中心位置:
(10) |
式中, fb(k)(x, y)为疑似肺结节检测二值化结果的第k个超像素中(x, y)点的像素值.为了降低算法的时间复杂度, (Cx, Cy)的计算只针对疑似肺结节.通常肺结节的(Cx, Cy)在continuity_pos范围内比较稳定, 而血管或支气管则会呈现明显偏移.
3 实验分析本文实验的硬件环境:CPU为Intel Core i7 -4790 k, 内存8 G.程序的运行环境是Windows 7操作系统下的Matlab R2013a.对于实验的数据集, 本文采用上海市胸科医院提供的200组病例和国际公认的LIDC数据集1 000组.
3.1 中心连续性实验图 6为肺结节的连续多帧标志图像, 并用白色区域表示.这3组图像是对LIDC数据库中的xml文件处理后得到的.
通过图 7中3D模型的描述, 可以很容易地区分肺结节与血管、支气管及胸膜等肺组织, 而其中最明显的特征就是肺结节具有质量中心连续性.
利用中心点偏移程度判断肺结节时, 选择不同的阈值会对结果造成一定的影响.
图 8所示为选定不同阈值的结果对比, 实验所用CT图像的分辨率为512×512.
敏感度描述的是算法检测出的肺结节占所有肺结节的比例, 而假阳性率(Fp)描述的是每个病人的CT图像集中误检的肺结节数量.在图 8中, 相同Fp下阈值为5时敏感度最高.所以, 对于分辨率为512×512的CT图像, 阈值的最优值为5个像素点.
图 9所示为利用肺结节的质量中心点连续性得到的肺结节检测结果, 算法判定的阳性肺结节用黄色边框的矩形区域表示.
本节选择文献[4], 文献[5]和文献[10]算法与本文算法进行对比.本文的数据来源于上海市胸科医院和LIDC数据库, 从中选取190个病人样本, 共包含286个肺结节.
根据表 1的数据对比, 本文算法的敏感度仅低于文献[5]的算法, 且明显高于其他两种算法.文献[5]的高敏感度主要来自两方面, 一是采用维度更高的特征来描述肺结节, 这会增加算法的计算量; 二是降低阈值, 这样可能会提高假阳性率, 而本文算法的Fp为1.76, 在4种算法中最低.所以, 本文的算法在保证假阳性率最低的情况下, 使敏感度达到最大.实验结果证明, 利用肺结节在3D空间上的中心点连续性检测肺结节是一种有效的方法.
本文针对2D空间中肺结节检测准确率较低的问题, 提出了基于3D空间中心点连续性的肺结节检测算法.通过与其他算法的比较, 本文算法在敏感度和Fp方面均表现良好,但是仍然存在一些问题需要解决, 其中主要问题为超像素分割的结果中包含的假阳性肺结节较多, 增加了算法的时间复杂度.
[1] |
Brandman S, Ko J P.
Pulmonary nodule detection, characterization, and management with multidetector computed tomography[J]. Journal of Thoracic Imaging, 2011, 26(2): 90–105.
|
[2] |
Choi W J, Choi T S.
Automated pulmonary nodule detection system in computed tomography images:a hierarchical block classification approach[J]. Entropy, 2013, 15(2): 507–523.
|
[3] |
El-Baz A, Beache G M, Gimel′farb G, et al. Computer-aided diagnosis systems for lung cancer: challenges and methodologies[J/OL]. [2016-06-20]. https://www.researchgate.net/publication/235691825_Computer-Aided_Diagnosis_Systems_for_Lung_Cancer_Challenges_and_Methodologies.
|
[4] |
Alilou M, Kovalev V, Snezhko E, et al.
A comprehensive framework for automatic detection of pulmonary nodules in lung CT images[J]. Image Analysis & Stereology, 2014, 33(1): 13–27.
|
[5] |
Demir Ö, Çamurcu A Y.
Computer-aided detection of lung nodules using outer surface features[J]. Biomedical Materials and Engineering, 2015, 26(sup1): 1213–1222.
|
[6] |
Foncubierta-Rodríguez A, Müller H, Depeursinge A.
Retrieval of high-dimensional visual data:current state, trends and challenges ahead[J]. Multimedia Tools and Applications, 2014, 69(2): 539–567.
DOI:10.1007/s11042-012-1327-2 |
[7] |
Achanta R, Shaji A, Smith K, et al.
SLIC superpixels compared to state-of-the-art superpixel method[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11): 2274–2282.
|
[8] |
Krishnamurthy S, Narasimhan G, Rengasamy U.
Three-dimensional lung nodule segmentation and shape variance analysis to detect lung cancer with reduced false positives[J]. Proceedings of the Institution of Mechanical Engineers, Part H:Journal of Engineering in Medicine, 2016, 230(1): 58–70.
DOI:10.1177/0954411915619951 |
[9] |
Li X, Wang X, Dai Y, et al.
Supervised recursive segmentation of volumetric CT images for 3D reconstruction of lung and vessel tree[J]. Computer Methods and Programs in Biomedicine, 2015, 122(3): 316–329.
DOI:10.1016/j.cmpb.2015.08.014 |
[10] |
Tan M, Deklerck R, Jansen B, et al.
A novel computer-aided lung nodule detection system for CT images[J]. Medical Physics, 2011, 38(10): 5630–5645.
DOI:10.1118/1.3633941 |