2. 东北大学 中荷生物医学与信息工程学院, 辽宁 沈阳 110169
2. School of Sino-Dutch Biomedical and Information Engineering, Northeastern University, Shenyang 110169, China
18F-氟代脱氧葡萄糖(18F-FDG)PET(positron emission tomography)图像是通过在体内静脉注入18F-FDG后获得脑细胞的葡萄糖代谢的功能图像(FDG-PET), 能够比血流更直接地反映脑神经活动, 在脑神经疾病“癫痫”的临床检查中受到医生的青睐.
临床判定PET图像癫痫病灶的主要方法包括目测法和半定量分析[1].医生通过勾画来设定感兴趣区域(ROI), 然后测定ROI的SUV(standard uptake value)[1]来对图像进行诊断.其中SUV是反映葡萄糖代谢状态的半定量指标, 表示局部组织摄取的显像剂的放射性活度.但是设定ROI区域需要大量的工作, 并且受主观性影响导致诊断结果的不确定性.相反, 全脑数据的研究不需要预先选择空间体素, 这就使其具有更高的准确性和更低的偏差[2].近年来许多基于全脑的分类研究都得到了较为理想的结果[3-4].Song等[5]提出了一种对全脑fMRI图像基于张量特征学习进行词汇反应的分类, 得到了很好的效果.
受文献[5]的启发, 本文将全脑体素的PET数据用3阶张量进行表示, 计算每个体素SUV, 用SUV代替PET全脑体素并表示为张量形式[6], 解决了ROI设定的问题.由于癫痫病灶通常具有不对称性, 本文定义了一种新的半脑对称度特征, 然后利用多线性主成分分析(MPCA)方法对半脑对称度张量模型进行特征选择, 最后基于支持向量机(SVM)分类器进行癫痫识别.
1 PET-SUV图像的张量表示PET图像本身是一种多维结构数据, 张量是对这类数据自然而本质的表达方式.与传统图像数据向量化的处理方式相比,张量这种数据表示方式可以更好地保留高维数据的内部结构和信息[7].为了解决PET图像中ROI设定的问题, 本文将左、右脑所有体素的SUV表示成张量形式[8].即首先计算PET图像的所有体素的SUV, 然后将PET-SUV图像按照对应体素的位置表示成3阶张量形式X1,X2,…,XM∈RI1×I2×I3, 其中M是脑数据样本个数, I1是每一个样本PET图像的断层个数, I2, I3分别是每个断层图像的水平、垂直分辨率.
2 癫痫特征的提取 2.1 半脑对称度特征的定义比较癫痫患者与正常人的PET图像中的脑对称区域发现:癫痫患者位于癫痫病灶一侧的大脑半球的葡萄糖代谢通常存在异常, 如图 1的箭头所示[1].在PET图像中, 可以利用SUV的差异性表现葡萄糖代谢异常.
为了描述位于病灶一侧的大脑半球的葡萄糖代谢异常, 本文在PET-SUV的断层图像上定义对称模板, 并利用这个对称模板分别遍历每个断层图像上的左、右半脑对称区域, 基于对称区域的SUV定义了半脑对称度特征.
构造对称模板及计算半脑对称度特征的方法如下:
① 首先将PET-SUV的每个断层图像均匀划分成左区域(左脑区)和右区域(右脑区).在左脑区及其中轴对称位置的右脑区分别设置n×n大小的模板, 左、右脑对称模板如图 1上方的2个灰色框所示.
② 使这两个对称模板(左脑模板、右脑模板)分别从PET-SUV图像的左上角和右上角出发, 按照从外向内、从上到下的顺序进行遍历.
③ 在每个遍历位置(i, j)计算半脑对称度特征.
本文提出了一种半脑对称度特征,其计算公式为
(1) |
其中:Si, j是半脑对称度; i与j分别为像素的横纵坐标, i=1, …, M, j=1, …, (N/2-n+1),M×N为PET-SUV图像的大小,n为模板的大小;VL_max与VR_max分别是左、右脑模板内SUV的最大值; VL+R是左、右脑模板两个区域内SUV的平均值; Vall是整个PET-SUV图像内SUV的平均值.
2.2 基于MPCA的特征降维由于是对全脑PET图像进行研究, 需要对整个大脑的所有体像素的SUV进行计算.计算得到的半脑对称度特征数量远远超过样本个数, 将导致过拟合现象[7], 因此需要通过降低特征维数来选择适量的特征用于分类器分类.
主成分分析(principal component analysis, PCA)是最常用的线性特征降维的方法[9].主成分分析的目的是将高维数据投影到较低维空间从而将一个多变量的复杂问题简化为低维空间的简单问题.为了将PCA应用到全脑特征的降维, 需要将所有特征集中在一个超高维的向量里, 不适合处理小样本问题.多线性主成分分析(multi-linear principal component analysis, MPCA)[10]是PCA在高维的延伸.本文利用MPCA将张量(tensor)投影到向量, 使运算在较低维子空间进行, 因此处理高维数据时有低运算量的优势.另外, MPCA是一种无监督学习方法[10], 将高维空间映射到低维空间并舍弃不重要的特征向量缩减维度.
将3阶张量X1,X2,…,XM∈RI1×I2×I3作为MPCA的输入, M是数据样本个数.通过3个(n=3) 投影矩阵U(n)∈RIn×Pn, n=1, 2, 3提取出低维张量特征Ym=Xm×U(1)T×U(2)T×U(3)T, Pn<In,使张量的维数从I1×I2×I3减少到P1×P2×P3.
投影矩阵的计算方法为
(2) |
其中,
MPCA将高维张量投影到低维张量, 且保持同样的顺序.在实际应用中, 低维张量展开到对应向量中Y→y, 其中{Y∈RP1×P2×P3, y∈Rp1p2p3}中的元素根据方差进行排序[9].MPCA实验的参数设置同文献[5].
3 癫痫分类模型的建立首先基于MPCA对张量表示的PET图像的半脑对称度特征进行降维, 然后将其作为支持向量机(support vector machine, SVM)[11-12]分类器的输入进行癫痫的分类, 步骤如下:
1) 输入PET图像, 计算所有体素的SUV并将其表示为3阶PET张量X1,X2,…,XM∈RI1×I2×I3, M是训练样本个数.
2) 提取半脑对称度特征, 将其表示为张量形式X11,X21,…,XM1∈RI1×I2×I3′, 其中I3′=I3/2-n + 1, n为提取半脑对称度特征时所用模板大小.
3) 基于MPCA对张量X11,X21,…,XM1∈RI1×I2×I3′进行降维, 得到特征向量组{y1, …, ym}.
4) 将{y1, …, ym}作为SVM分类器的输入, 建立癫痫分类模型, 并采用3-fold交叉验证进行分类, 输出识别准确率.
为了评价模型的性能, 基于式(3), 式(4), 式(5) 分别计算样本的分类准确率RAC, 敏感性RSP和特异性RSE.
(3) |
(4) |
(5) |
其中:α是测试集中正常脑样本个数; β是癫痫脑样本个数; αt是正确识别正常脑样本个数; αf是错误识别正常脑样本个数; βt是正确识别癫痫脑样本个数; βf是错误识别癫痫脑样本个数.
4 实验结果与分析为了验证本文方法的有效性, 分别选取11例癫痫、12例正常脑PET图像作为实验数据.患者进行PET扫描之前禁食6 h以上, 于安静状态下静脉注射18F-FDG.安静平躺半小时后开始进行图像采集工作.然后对采集到的FDG-PET图像进行标准化和高斯平滑处理, 得到128×128×35的图像.本文软件平台为MATLAB 2014b.
实验中以2×2模板提取的半脑对称度特征为研究对象, 分别将基于MPCA与PCA降维后的特征输入SVM及KNN(K-nearest neighbor)[13]分类器.根据不同的特征选择方法以及不同的分类器构造出4种不同的分类模型, 即MPCA-KNN, MPCA-SVM, PCA-KNN, PCA-SVM, 分别进行癫痫分类实验.分类结果如表 1所示.
从表 1可以看出, MPCA-KNN分类准确率为91.3%, MPCA-SVM分类准确率为96.5%, PCA-KNN分类准确率为72.3%, PCA-SVM分类准确率为80%.无论利用何种分类器, 基于MPCA的特征降维方法均优于PCA降维方法.
为了研究模板大小对分类准确率的影响, 本文分别利用2×2, 3×3, 4×4大小的模板提取半脑对称度特征进行实验.通过MPCA降维后, 再利用SVM, KNN分类器分类, 模板大小对分类结果的影响如表 2所示.
从表 2可以看出, 基于MPCA-KNN的分类准确率最高为91.3%(2×2模板), 而基于MPCA-SVM分类准确率高达96.5%(2×2模板).显然利用SVM分类器对于脑PET图像的癫痫识别具有很好的分类效果.对于半脑对称度特征提取过程中模板的选用, 无论利用SVM还是KNN, 2×2模板的分类准确率均为最高, 同时其敏感性和特异性的综合性能最优.
不同特征维数对分类准确率的影响也不同, 如图 2所示.
从图 2可以看出, 对于2×2模板, 在特征维数为135时准确率最高值96.5%;对于3×3模板, 特征维数在[80, 180]区间, 准确率基本保持稳定在88.4%;对于4×4模板, 只有在特征维数为40时准确率达到最大值88.7%, 之后准确率随特征维数的增加呈递减趋势.
为了比较本文方法对癫痫识别的有效性, 对比了现有的两种癫痫识别的方法[14-15], 如表 3所示.
其中, Z分数峰值分析法和多参数定量分析法主要是针对PET图像中ROI区域进行研究, 相比之下本文提出的方法在保证准确率的同时又省去了大量勾画ROI区域的工作, 具有一定的优越性.
从实验结果中可以看出, 利用张量结构表示PET图像并提取半脑对称度特征用于分类这种方法对癫痫的识别有着很好的效果.对于PET等三维图像, 图像内部结构尤为重要, 传统的图像处理方式是将其转换为二维矩阵形式进行分析, 但这样做不利于保存数据内部结构信息.PET脑图像数据通过张量表示可以减少图像内部信息的损失.对于癫痫的PET图像诊断, 主要是考虑大脑区域的SUV分布, 左右脑SUV分布不均则疑似存在癫痫病灶, 因此半脑对称度特征很大程度上代表了SUV的分布特点.本实验中癫痫数据集为11例, 其中, 7例为颞叶癫痫, 2例为顶叶癫痫, 2例为额叶癫痫, 不同病灶区的SUV分布对分类的准确率也存在一定影响.本文研究了癫痫脑PET图像与正常脑PET图像的分类, 对于准确定位病灶区域以及识别出具体类型的病灶未来还具有很大的研究空间.
5 结语本文提出了一种基于张量子空间的半脑对称度特征并结合SVM识别癫痫的方法.该方法克服了传统医学图像病灶识别中医生设定ROI带来的大工作量和主观性等问题.将数据表示成张量形式可以很好地保存全局数据结构完整性信息.实验结果表明, 本文提出的方法对全脑PET图像的癫痫识别具有很高的准确率, 可以辅助医生进行癫痫疾病的诊断.本文方法虽然能够自动识别PET图像是否存在癫痫病灶, 但是还无法准确确定癫痫病灶的具体位置, 病灶的准确定位是下一步的研究方向.本文的研究对阿茨海默症等神经疾病的研究也具有借鉴意义.
[1] | Fougère C, Rominger A, Geisler J, et al. PET and SPECT in epilepsy:a critical review[J].Epilepsy & Behavior, 2009, 15(1): 50–55. |
[2] | Batmanghelich N, Dong A, Taskar B.Regularized tensor factorization for multi-modality medical image classification[C]//International Conference on Medical Image Computing and Computer-assisted Intervention.Fichtinger:Springer, 2011:17-24. |
[3] | Ryali S, Supekar K, Abrams D, et al. Sparse logistic regression for whole-brain classification of fMRI data[J].NeuroImage, 2010, 51(2): 752–764. DOI:10.1016/j.neuroimage.2010.02.040 |
[4] | Ecker C, Johnston P, Murphy C, et al. Investigating the predictive value of whole-brain structural MR scans in autism:a pattern classification approach[J].NeuroImage, 2010, 49(1): 44–56. DOI:10.1016/j.neuroimage.2009.08.024 |
[5] | Song X, Meng L, Shi Q, et al.Learning tensor-based features for whole-brain fMRI classification[C]//International Conference on Medical Image Computing and Computer-assisted Intervention.New York:Springer-Verlag, 2015:613-620. |
[6] | Bader B W, Kolda T G. Algorithm 862:MATLAB tensor classes for fast algorithm prototyping[J].ACM Transactions on Mathematical Software, 2006, 32(4): 635–653. DOI:10.1145/1186785 |
[7] | Acar E, Dunlavy D M, Kolda T G. A scalable optimization approach for fitting canonical tensor decompositions[J].Journal of Chemometrics, 2011, 25(2): 67–86. DOI:10.1002/cem.v25.2 |
[8] | Chi E C, Kolda T G. On tensors, sparsity, and nonnegative factorizations[J].SIAM Journal on Matrix Analysis and Applications, 2012, 33(4): 1272–1299. DOI:10.1137/110859063 |
[9] | Jackson J E.A user's guide to principal components[D].New York:John Wiley & Sons, 1991. |
[10] | Lu H, Plataniotis K N, Venetsanopoulos A N. MPCA:multilinear principal component analysis of tensor objects[J].IEEE Transactions on Neural Networks, 2008, 19(1): 18–39. DOI:10.1109/TNN.2007.901277 |
[11] | Mourao-Miranda J, Reynaud E, McGlone F, et al. The impact of temporal compression and space selectionon SVM analysis of single-subject and multi-subject fMRI data[J].NeuroImage, 2006, 33(4): 1055–1065. DOI:10.1016/j.neuroimage.2006.08.016 |
[12] | Chang C C, Lin C J. LIBSVM:a library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 1–27. |
[13] | Wang W, Zhang X, Gombault S. Constructing attribute weights from computer audit data for effective intrusion detection[J].Journal of Systems and Software, 2009, 82(12): 1974–1981. DOI:10.1016/j.jss.2009.06.040 |
[14] | Soma T, Momose T, Takahashi M, et al. Usefulness of extent analysis for statistical parametric mapping with asymmetry index using inter-ictal FGD-PET in mesial temporal lobe epilepsy[J].Annals of Nuclear Medicine, 2012, 26(4): 319–326. DOI:10.1007/s12149-012-0573-8 |
[15] | Goubran M, Mirsattari S. Detection of temporal lobe epilepsy using support vector machines in multi-parametric quantitative MR imaging[J].Computerized Medical Imaging and Graphics, 2015, 41: 14–28. DOI:10.1016/j.compmedimag.2014.07.002 |