2. 中国医科大学 公共基础学院, 辽宁 沈阳 110122
2. School of Public Foundation, China Medical University, Shenyang 110122, China
在目前的医疗设备中, CT扫描具有敏感性好、漏诊率低等优点, 是诊断肺癌的重要手段.但由于患者数量多以及CT影像数据量巨大, 导致医生应接不暇, 增加了漏诊和误诊几率[1].因此, 通过计算机自动检测肺癌作为前期的诊断依据具有非常重要的意义.
肺癌的诊断过程十分复杂, 目前已经涌现出很多判断肺实质和结节的方法[2]:基于规则的阈值法[3]、数学形态学[4]、遗传算法[5]和聚类[6]等.虽然这些方法通过近几年的发展, 在速度和质量上得到很大提升, 应用领域不断扩大, 但是仍然没有达到常规临床使用水平.在肺部CT影像中, 结节边界的模糊程度是判断肺癌的最重要指标[7].因此对可疑结节的准确分割及其边界模糊程度的判断将直接决定检测的准确性.针对结节普遍存在噪声和弱边缘化等特性, 水平集方法是一种效果较为理想的分割方法.本文采用的CV模型及新提出的改进ME模型都是针对水平集方法的改进算法, 通过两个水平集模型分割得到的区域之间的面积差异来计算结节边界模糊程度.最后, 使用上海某医院的肺部CT影像数据集进行了肺结节的模糊程度分析与检测, 确定阈值, 并验证本文检测算法的有效性.
1 基于水平集的图像分割算法在肺部结节检测过程中, 结节边缘普遍存在模糊和淡化现象, 导致传统图像分割算法分割的边缘不连续.水平集方法通过在笛卡尔网格 (Cartesian grid) 上对进化的曲线曲面进行数值计算而不必对曲线曲面参数化, 能够获得相对清晰的边缘效果[8].在所有针对水平集方法的改进中, Chan-Vese提出的CV模型是一种较为经典的改进方法[9].此外, 由Rousson-Deriche提出的基于均方差的水平集方法——ME模型 (mean square error model)[10]能够保证分割的动态轮廓较为清晰准确.
1.1 CV模型CV模型是一种主动轮廓图像分割模型.该模型利用区域内外部灰度平均值作为能量函数, 通过能量函数最优化来分割目标区域.CV模型的内外部能量函数表示为
(1) |
式中:C1, C2分别表示待分割轮廓C外部和内部的平均水平值; I (x, y) 表示该点的水平值;μ≥0;ν≥0;λ1≥0;λ2≥0.图像中每一个像素都被定义一个水平值, 水平值在轮廓C内部大于0, 而在轮廓C外部小于0, 正好在轮廓C上时等于0.动态轮廓C以定义的速度在曲线法线方向上扩展, 最终停在分割目标的边缘.
如果λ1=λ2=1, μ=ν=0, CV模型中的每个点在法线方向上的速度函数表示为
(2) |
利用CV模型分割图像虽然检测目标效果良好, 但是仍然存在问题.由式 (2) 可知, 因为CV模型的速度函数基于平衡动态轮廓外部和内部的像素值, 所以对于目标轮廓的边缘检测收缩率比较高.在肺部CT影像中, 由于恶性肿瘤边界比较模糊, CV模型的高收缩率使分割忽略肿瘤周围的模糊部分, 导致分割出来的结节区域小于肿瘤的实际区域, 从而产生误差.
1.2 ME模型ME模型假设动态轮廓内外部像素值分布为高斯分布, 利用均方差将动态轮廓逼近至目标边缘.基于均方差的ME模型函数表示为
(3) |
由式 (3) 可得, ME模型各点在法线方向上的速度函数表示为
(4) |
基于均方差的ME模型, 能够保证在运动方向上分割的目标轮廓较为清晰准确.但是, 由于其模型抗噪能力较差, 且算法时间复杂度较高, 不适用于一些时效性要求较高的场景.针对这些问题本文提出了一种新的基于ME模型的交互式目标分割算法.
2 基于CV模型与改进ME模型的恶性肺结节检测算法首先针对ME模型的缺点提出了一种新的交互式目标分割算法.该算法通过对ME模型速度函数的改进, 大大提高了算法的抗噪能力及运算速度.然后根据由CV模型与改进的ME模型分割算法得到的两个区域之间的面积差来判断肺部结节边缘的模糊程度, 以此判断是否为疑似恶性肺结节.
2.1 改进ME模型的图像分割算法为解决ME模型抗噪能力差及算法时间复杂度高等问题, 利用基于像素值的梯度向量可以使动态轮廓尽快移动.但基于像素值的梯度向量, 仅在像素值的变化较大的区域有效, 在靠近目标轮廓时, 动态轮廓收敛速度很慢.为加速动态轮廓收敛速度, 本文利用文献[11-12]提出的GVF (gradient vector flow) 模型.这个模型将图像目标边缘的梯度值组成向量场.GVF向量场表示为VGVF(x, y)={(u (x, y), v (x, y))}, u (x, y) 和v (x, y) 是边缘x, y方向梯度值的分量, 它们可由式 (5) 所表示的能量函数的最小化求出.
(5) |
式中:f (x, y) 是边缘轮廓; μ是调整因数, 噪声越多, 其值越大 (0 < μ < 1).因为图像上每个点的GVF方向均指向目标轮廓, 在靠近目标轮廓时其值较大, 在像素值相似的区域其值较小, 用水平集方法求出法线方向速度函数F1为
(6) |
式中:div (VGVF) 是在VGVF域内的一个点上的向量场的散度.将ME模型速度函数F2添加长度整齐 (regularity term) 项, 其表示为
(7) |
将轮廓信息项与区域信息项相结合, ME模型改进后的总体速度函数如式 (8) 所示:
(8) |
式中, α+β=1, α和β的值随着图像噪声不同进行调整, 图像的噪声越多, α取值越大.
改进ME模型图像分割算法具体流程见图 1.
在肺部CT影像中, 判断肿瘤是恶性还是良性的最重要的特征是肿瘤边界模糊的模糊程度.如果某一肿瘤的特点是内部比较密实, 而外部比较模糊, 且模糊的范围较大, 其是恶性肿瘤的概率非常大.本文提出的检测算法是要找出CT影像中具有这种特点的区域.CV模型和2.1中改进的ME模型这两种图像分割算法在效果上最明显的不同就是对于恶性肺结节得到的区域面积不同.利用这一特点, 本文提出一种基于肺结节模糊程度的恶性肺结节检测算法.
CV模型和改进ME模型两种图像分割方法的速度函数不同, 导致在图像变化较小区域两种方法的收敛速度不同.CV模型通过像素值的梯度变化判断边界, 在肿瘤边界模糊时像素值变化缓慢, 像素梯度值变化幅度随之降低, 导致CV模型的收敛率比较高, 即由CV模型分割的边缘比较靠近中心的密实部分.反之, 改进ME模型算法由于使用GVF模型, 在像素值变化不大的情况下仍然有较好的收敛性, 以及分割的结果能够尽量多地包含模糊区域, 使分割结果更加准确和全面.两种模型对肺部CT影像分割效果如图 2所示.
由图 2可知, 两个方法都分割出了目标区域, 但是区域的大小明显不同.改进的ME模型分割的区域 (主要为图 2b中三角区域) 比CV模型包含了更多的轮廓模糊区域.对于一个边缘清晰的区域, 这两种模型的分割结果比较接近, 而对于一个边缘模糊区域, 两种方法的分割结果差别较大, 即两种方法的分割结果差别越大, 这个区域的边缘模糊部分就越大, 是恶性肿瘤即癌症的概率也越大.
为了具体判定两种方法分割结果的差别程度, 可以计算两个结果的面积差异, 然后把这差异值归一化.图 3表示了归一化过程的原理.
图 3中:Sour和SCV分别表示了由本文提出的模型和CV模型的区域面积值; Lour和LCV分别表示了由本文提出的模型和CV模型的区域周长值; L为平均周长; d表示了模糊部分的平均厚度.这样可用模糊部分的平均厚度表示感兴趣区域的模糊程度.感兴趣区域模糊程度d计算公式为
(9) |
由图 3和式 (9) 可知, 模糊程度d越小, 说明边界越模糊, 这部分是恶性肿瘤的概率越大.
3 实验结果与分析本文实验使用一台配置Intel Core I7-4770k处理器和8GB DDR3内存的商用台式机.实验数据集使用上海某医院提供的真实肺部CT影像数据集, 该数据集包括2015年下半年该院的多组患者的肺部CT影像.
由于篇幅所限本文列举4组分割影像的实验结果 (患者代号依次为00859633, 00885042, 00885012, 00882004), 4组实验结果如图 4所示.
图 4为随机选取的4名患者的CT影像分割结果, 每组图片包含3张图片, 其中第一张是CV模型的分割结果; 第二张是本文提出模型的分割结果; 第三张为经过对比后产生的分割对比结果.结果中大框的部分表示模糊程度值d高于阈值的部分, 即检测为恶性肺结节的区域.小框表示模糊程度值d较高的区域, 为疑似恶性肺结节区域部分.
本文之所以选用小框标识疑似恶性肺结节区域部分, 是因为将阈值设置偏大会避免发生漏诊现象, 在医疗领域中, 漏诊会造成患者错过最佳的治疗时机, 导致严重的生命危险.但是如果阈值太小则会造成被分割出来的非恶性肺结节区域较多, 大大降低了分割的意义.综上通过大小框标记, 可以区分恶性肺结节的区域和疑似恶性肺结节的区域.
以上4组数据中, 第1组为肺炎患者的CT影像, 第2组和第4组为早期肺癌患者的CT影像, 第3组为处于中晚期的肺癌患者的CT影像.与本文检测算法结果对比, 第2, 3, 4组影像被准确分割且标注出了恶性肺结节部分, 由此可知, 本文算法可以对恶性肺结节进行准确地分割和检测.但是第1组仍然有4个区域被标注出来, 而且有一个肺炎区域的模糊程度达到了恶性肺结节阈值水平, 此外标注出的疑似恶性肺结节区域只有第3组被确诊为肺癌.后续需要更进一步的提高分割精度.
由于数据集巨大, 本文随机选择9组数据的放射学诊断与本文检测算法统计对比, 实验结果如表 1所示.
通过表 1中的统计可知, 这9组CT影像中有7组的放射学诊断与本文的检测算法的诊断结果一致, 包括6组诊断为癌症, 1组诊断为其他疾病.
对于本文算法的可靠性, 使用特异性与灵敏度进行评估.特异性是测量试验正确地检测无病者的能力, 即将实际无病的人正确地检测为真阴性的比例, 灵敏度用来衡量某种试验检测出有病者的能力, 即将实际有病的人正确地判定为真阳性的比例, 见式 (10) 和式 (11):
(10) |
(11) |
式中:A为真阴性人数; B为真阳性人数; Sumf为实际阴性的人数; Sump为实际阳性的人数.医师先验知识诊断与本文检测算法对比如表 2所示.
医师先验知识诊断是由两名核医学科医师结合CT影像病灶的大小、形态等解剖特征, 依靠专业知识综合诊断肺部病灶良恶性.本文检测算法根据分割的结节模糊程度是否达到阈值水平来判断是否为疑似恶性肺结节 (即图 4中的大框部分).
对于判断结果与放射学诊断不一致的两个病例, 经过分析有如下原因:通过观察00859633号患者的CT影像发现, 虽然在放射学诊断中的结果是肺炎, 但是该区域属于磨玻璃影结节 (ground glass opacity, GGO), 与肺癌的病理表现非常相似.对于这样的问题, 需要在后续的研究中提取关于肺癌的更多的特征, 以区分这两种相似区域.对于00885665号患者, 放射学诊断为可能出现占位性病变, 这说明该区域有出现癌症的可能, 但是还不能够确定, 针对这种情况, 本文检测算法将其诊断为癌症以避免发生漏诊.
4 结语本文提出了一种基于水平集方法中的CV模型与改进ME模型的分割区域的模糊程度的肺部CT影像癌症检测算法, 由实验可知, 本文算法的灵敏度较高, 与医师先验知识诊断结果非常接近, 说明对肺癌的诊断比较可靠.但是目前样本特异性较低, 其受到样本总数制约, 这点将在后续工作中随着样本量的增加而改进.并试图针对癌症区域的大小和数量做更详细统计.总之, 该方法在对肺癌的检测上具有可行性, 在未来的改进中仍然存在提升空间.
[1] |
翟志伟. 基于CT图像的肺部肿瘤检测与诊断[D]. 哈尔滨: 哈尔滨工业大学, 2014.
( Zhai Zhi-wei.Detection and diagnosis of lung nodules on CT images[D]. Harbin:Harbin Institute of Technology, 2014. ) |
[2] |
崔颖, 王小鹏, 于挥.
肺实质CT图像分割方法[J]. 计算机工程与设计, 2015, 36(5): 1274–1310.
( Cui Ying, Wang Xiao-peng, Yu Hui. Segmentation method for CT image of lung parenchyma[J]. Computer Engineer and Design, 2015, 36(5): 1274–1310. ) |
[3] | Armato S G, Sensakovic W F. Automated lung segmentation for thoracic CT[J]. Acad Radiol, 2004, 11(9): 1011–1021. DOI:10.1016/j.acra.2004.06.005 |
[4] | Hu S, Hoffman E A, Reinhardt J M. Automatic lung segmentation for accurate quantitation of volumetric X-ray CT images[J]. IEEE Transaction on Medical Imaging, 2001, 20(6): 490–498. DOI:10.1109/42.929615 |
[5] | Awai K, Murao K, Ozawa A, et al. Pulmonary nodules at chest CT:effect of computer-aided diagnosis on radiologists' detection performance[J]. Radiology, 2004, 230(2): 347–352. DOI:10.1148/radiol.2302030049 |
[6] | Gurcan M N, Sahiner B, Petrick N, et al. Lung nodule detection on thoracic computed tomography images:preliminary evaluation of a computer-aided diagnosis system[J]. Medical Physics, 2002, 29(11): 2552–2558. DOI:10.1118/1.1515762 |
[7] |
张周芳, 黄洁惠, 邵国良.
双源CT双能量成像在肺癌病理类型鉴别中的应用价值[J]. 肿瘤学杂志, 2015, 21(5): 392–395.
( Zhang Zhou-fang, Huang Jie-hui, Shao Guo-liang. Application value of dual-energy CT imaging in the differential diagnosis of pathological types of lung cancer[J]. Journal of Chinese Oncology, 2015, 21(5): 392–395. DOI:10.11735/j.issn.1671-170X.2015.05.B009 ) |
[8] | Osher S, Paragios N. Geometric level set methods in imaging, vision, and graphics[M]. Berlin: Springer, 2003. |
[9] | Chan T F, Vese L A. Active contours without edges[J]. IEEE Transactions on Image Processing, 2001, 10(2): 266–277. DOI:10.1109/83.902291 |
[10] | Rousson M, Deriche R.A variational framework for active and adaptative segmentation of vector valued images[C]//Motion and Video Computing.New York:IEEE, 2002:56-61. |
[11] | Xu C Y, Prince J L. Snakes, shapes and gradient vector flow[J]. IEEE Transactions on Image Processing, 1998, 7(3): 359–369. DOI:10.1109/83.661186 |
[12] | Chuang C H, Lie W N. A downstream algorithm based on extended gradient vector flow field for object segmentation[J]. IEEE Transactions on Image Processing, 2004, 13(10): 1379–1392. DOI:10.1109/TIP.2004.834663 |