2. 福建省医疗器械与医药技术重点实验室, 福州 350108;
3. 厦门理工学院 光电与通信工程学院, 福建 厦门 361024;
4. 福建省生态产业绿色技术重点实验室, 福建 南平 354300
2. Fujian Provincial Key Laboratory of Medical Instrument and Pharmaceutical Technology, Fuzhou Fujian 350108, China;
3. School of Opto-Electronic and Communication Engineering, Xiamen University of Technology, Xiamen Fujian 361024, China;
4. Fujian Provincial Key Laboratory of Eco-Industrial Green Technology, Nanping Fujian 354300, China
阿尔兹海默症(Alzheimer's Disease, AD)是一种常发病于老年人群的痴呆症状,即老年痴呆症,其患者通常具有进行性记忆丧失和语言障碍等症状。随着社会老龄化的发展,其发病率也将随之增长。预计在2050年,中国的老年痴呆症患者将可能达到2000万[1]。对于阿尔兹海默症的计算机诊断通常使用脑部成像,例如结构性磁共振成像(structural Magnetic Resonance Imaging, sMRI)[2]、功能性磁共振成像(functional Magnetic Resonance Imaging, fMRI) [3]和正电子发射计算机断层显像(Positron Emission computed Tomography, PET)[4]等图像数据。其中sMRI由于其相对较低的成本和较好的成像效果,常被应用于脑部疾病的研究。MRI作为三维图像含有大量的体素数据,其中大部分与阿尔兹海默症无关,所以如何从大量的体素数据中进行疾病相关的特征提取成了研究的主要内容[5-6]。但是目前已有的方法中还较少使用卷积神经网络(Convolutional Neural Network, CNN)进行阿尔兹海默症相关特征的提取和疾病诊断。
本文主要研究利用卷积神经网络对MRI进行阿尔兹海默症的自动诊断。深度神经网络常被应用于机器自动识别,在阿尔兹海默症的自动识别上也具有良好的效果[7-8]。卷积神经网络作为深度神经网络的一种网络结构[9],自2012年的ILSVRC比赛后就受到许多关注, 并在许多计算机视觉的应用中性能超越了其他算法。由于阿尔兹海默症会导致患者海马体区域出现萎缩,患者的脑部与正常人的脑部有视觉上的区别,如图 1所示,因此可以使用卷积神经网络对MRI进行自动识别。本文提出了一种基于卷积神经网络对MRI进行阿尔兹海默症的计算机诊断方法,使用ADNI数据库提供的229位正常人(Normal Control, NC)和188位患者(AD)共417个MRI进行分类测试。文献[7-8]都采用了深度神经网络的方法对阿尔兹海默症进行分类诊断,而且两者对NC和AD的分类准确率都达到91.4%,但是文献[8]方法利用了MRI、PET数据,文献[7]除了MRI、PET数据,还使用了脊髓液(CerebroSpinal Fluid, CSF)信息。使用多种数据信息在实际应用中成本相对较高,相关数据难以获取。例如CSF数据可能需要通过脊椎穿刺获取,大部分人群难以接受。而PET成像有较强的辐射,并且同时进行MRI和PET成像相对成本也较高。本文集中研究仅利用MRI图像进行辅助诊断,利用非刚性配准、年龄矫正、海马体区域2.5D图像提取和数据增广等处理以及卷积神经网络进行识别,如图 2所示。经多次十折交叉验证测试,该方法具有良好的诊断准确率。
本文使用的MRI数据来自ADNI(Alzheimer's Disease Neuroimaging Initiative)数据库(adni.loni.ucla.edu),该数据库公开提供一系列测试对象的MRI、PET、其他生物标记和相关的诊断信息,为研究人员提供了一套标准的研究数据,用于研究阿尔兹海默症的发病过程。其提供的数据包含了三套子库,分别是ADNI-1、ADNI-2和ADNI GO。本文使用的数据来自ADNI-1的标准基准库包含的818个测试对象的1.5T MRI[10]。该818位测试对象分别是229位正常人、188位患者和401位轻度认知功能障碍者。其中轻度认知功能障碍者并不属于阿尔兹海默症患者,但是其部分对象有可能在接下来的几年中发病成为患者。本文主要使用全部417位正常人与患者的MRI数据进行识别测试,测试过程中未删除任何样本数据。这些测试对象的年龄分布从55岁到90岁,男性218人,女性199人。具体年龄和性别的分布如表 1所示。
本文使用的417位测试对象的MRI由于个体差异存在脑部尺寸、形状、位置上的较大区别,因此首先需要对这些数据进行一系列预处理[11],保证图形之间有可比较性。首先所有的MRI都进行标准的ADNI流水线处理,然后进行颅骨剥离,保留脑部图像。为了进行比较,所有的MRI都需要进行配准,颅骨剥离后的图像使用基于B样条的自由变形配准到MNI152模板上。对于配准的精度选择,如果配准太粗糙则配准效果不明显;而如果配准太精确则会导致测试个体间的区别大量丢失,区分度不高。因此本文选择5 mm距离的配准精度,可以达到较好的分类准确率[11]。最后对配准后的图像进行基于直方图的数值归一化处理。
1.3 年龄矫正经过上述预处理的MRI已经可以进行卷积神经网络的训练和识别,但是为了提高准确率,本文采用了年龄矫正的预处理[12]。由于本文使用卷积神经网络进行图像识别的方式主要是基于海马体区域的脑部形态,阿尔兹海默症患者相较于正常人的脑部会出现萎缩现象。然而正常人的脑部随着年龄的增加也会出现萎缩的情况,在识别过程中会与患者的病理萎缩混淆,年龄矫正可以降低脑部正常萎缩对识别的影响。
年龄矫正基本思路是:将某个坐标的体素值作为y,其年龄作为x,然后使用所有的正常人的该坐标体素值yn和年龄xn进行线性回归,拟合到曲线y=ax+b,其中a和b是实数,可以从系数a得知该体素值随着年龄增长的正常变化趋势。然后对所有MRI(包含正常人和患者)的该坐标体素值矫正到某个固定年龄上,即完成该坐标点的年龄矫正。对所有的坐标点都进行上述处理,即完成年龄矫正的过程。
年龄矫正的具体实现过程为,设置年龄矩阵X、体素值矩阵Y和系数矩阵β:
$ \begin{array}{l} \mathit{\boldsymbol{X}} = {\left[{\begin{array}{*{20}{c}} {{x_1}}&{{x_2}}& \cdots &{{x_N}}\\ 1&1& \cdots &1 \end{array}} \right]^{\rm{T}}}\\ \mathit{\boldsymbol{\beta }} = \left[{\begin{array}{*{20}{c}} {{a_1}}&{{a_2}}& \cdots &{{a_M}}\\ {{b_1}}&{{b_2}}& \cdots &{{b_M}} \end{array}} \right]\\ \mathit{\boldsymbol{Y}} = \left[{\begin{array}{*{20}{c}} {{y_{11}}}&{{y_{12}}}& \cdots &{{y_{1M}}}\\ {{y_{21}}}&{{y_{21}}}& \cdots &{{y_{2M}}}\\ \vdots&\vdots &{}& \vdots \\ {{y_{N1}}}&{{y_{N2}}}& \cdots &{{y_{NM}}} \end{array}} \right] \end{array} $ |
其中:N是正常测试对象的数量;M是预处理后单个MRI的体素数量。建立线性回归模型如下:
$ \mathit{\boldsymbol{Y}} = \mathit{\boldsymbol{X\beta }} + \mathit{\boldsymbol{\varepsilon }} $ | (1) |
式中,ε是线性回归的误差,目标是寻找最优的系数矩阵β使得∑ε2最小,其解为:
$ \mathit{\boldsymbol{\beta }} = {\left( {{\mathit{\boldsymbol{X}}^{\rm{T}}}\mathit{\boldsymbol{X}}} \right)^{-1}}{\mathit{\boldsymbol{X}}^{\rm{T}}}\mathit{\boldsymbol{Y}} $ | (2) |
由系数矩阵β可得到每个体素值与年龄的变化趋势系数a1, a2…, aM。本文根据该系数与测试对象的年龄,将所有测试对象的体素值矫正到年龄70岁的数值上。最后由于后期输入卷积神经网络的数据数值范围是0至255,矫正后的体素值超过255则置为255,低于0则置0。
1.4 卷积神经网络2012年AlexNet在ILSVRC大赛上获得优胜后,引发了卷积神经网络的研究热潮。虽然卷积神经网络经常应用于计算机视觉对自然图像的识别,然而它在医学图像上的视觉识别上也取得优秀的成绩[13-14]。本文使用开源的深度神经网络框架caffe搭建卷积神经网络对预处理后的MRI进行训练和识别测试。caffe实现了深度神经网络中常用的各种网络层,使用者只需要使用所需网络层搭建起整个神经网络。caffe还集成了Nvidia公司提供的cuda和cudnn,可以调用Nvidia显卡GPU进行并行运算,大大提高了运行速度。本文使用caffe搭建了卷积神经网络包含了三个卷积层和一个全连接层,网络结构如图 3所示。
该网络第一层的输入是长宽为32×32的3通道RGB图像,中间经过了三次卷积、池化、局部响应归一化(Local Response Normalization, LRN)和修正线性单元(Rectified Linear Units, ReLU)激活函数,输出由softmax层提供的分类结果。该卷积神经网络虽然不属于大型网络,但仍具有相对较多的网络参数,例如第一个卷积层有参数1216个,第二个卷积层有参数6416个,第三个卷积层有参数12832个,再加上全连接网络的参数1024个,该网络的参数达到了21488个。而本文使用的样本数量只有417个,相对于网络参数数量少了许多,训练过程中会存在过拟合问题。在上述预处理后的MRI的数据是182×218×182大小的3D单通道图像,为了符合该卷积神经网络的输入格式,本文采用2.5D图像的提取方式[15]。首先在3D图像中选择一个点,然后以该点为中心从三个轴向上截取三幅32×32的2D图像,如图 4所示。以这三幅图像作为RGB图像的三个通道,可以得到一幅32×32的3通道图像作为卷积神经网络的输入。显然一个MRI只提取一幅2.5D图像无法准确提取有效信息,而且中心点的位置选择也很重要。本文使用数据增广的方式[9],在一个MRI中选择多个中心点提取多幅2.5D图像,然后使用这些2.5D图像的分类结果共同判决该MRI的分类。该方式不仅保证了从MRI中提取足够的信息,而且通过增加训练图像的数量有效抑制卷积神经网络的过拟合问题。
对于多个中心点的位置选择,本文将这些中心点设置在海马体区域内。首先将所有测试对象的脑组织分割区域数据根据上述配准过程配准到MNI152模板上,之后将配准后的所有海马体区域进行重叠,获得一个能包含所有测试对象海马体的区域。最后将该区域进行4个体素的收缩后作为兴趣区域(Region Of Interest, ROI),收缩的原因是为了让中心点的选择在海马体区域内,而不是在海马体之外或边缘处。在ROI区域中每隔2个体素设置1个中心点,一共提取出151个中心点均匀地分布在整个ROI区域,如图 5所示。虽然中心点的选择限制在该ROI区域内,但每次提取的数据是以这些点为中心的32×32的图像,所以实际提取的信息是包含海马体及其周围较大区域的信息。
本文的测试对象共417个MRI,每个MRI提取151幅2.5D图像,共62967幅图像。使用10折交叉验证,则训练图像有56776幅,测试图像6191幅。训练样本扩大到了5.67万个,有效抑制了过拟合问题。对于每幅2.5D图像,softmax输出层会输出该幅图像对应两种分类的概率,最终判决该图像为概率最大的分类。而每个MRI的分类判决都由提取自该MRI的151幅图像共同判决。本文采用两种共同判决方式并进行比较:第一种是151幅图像分别进行分类判决,然后统计各分类的数量,数量最多的分类为该MRI的分类,称为判决平均;第二种属于软判决方式,将151幅图像对应各分类的概率进行平均,最后平均概率值最大的分类为该MRI的分类,称为概率平均。
2 实验结果与分析本文使用Matlab对数据进行预处理,使用caffe开源框架搭建卷积神经网络进行训练和识别。测试运行环境是:CPU为Intel i7 7700,GPU为GeForce GTX 1070,内存为8 GB,操作系统为ubuntu16.04,安装CUDA 8.0库文件,Matlab版本为2014b。
使用417位对象的MRI进行测试,将MRI经过预处理和年龄矫正后,从每个MRI提取151幅2.5D图像后打乱顺序进行卷积神经网络的训练。卷积神经网络的参数调整方法使用随机梯度下降,学习率(learning rate)为0.001、动量因子(momentum)为0.9、权重衰减(weight decay)为0.004。每次训练小块(batch)大小为151幅2.5D图像,共训练11280次,即训练过程中每幅图像被用于训练30次(epoch)。
测试过程使用10折交叉验证。首先将所有对象的顺序打乱,各类型对象均匀分布; 然后选择其中41位对象作为测试样本,其余376位作为训练样本进行训练和测试, 依次进行10次可以对410位对象进行测试,10次测试的平均准确率、平均敏感度(真实阳性对象中被诊断成阳性的数量/真实阳性对象数量)和平均特异度(真实阴性对象中被诊断为阴性的数量/真实阴性对象数量)作为本次的测试结果。该方式存在测试过程中会有7位对象未被测试,而且单次测量无法有效判断真实的测试准确率。所以本文将上述测试过程重复30次,每次都重新打乱对象的顺序,因此测试结果相对可靠,而且能测试到所有样本。本文对未进过年龄矫正和经过年龄矫正,以及判决平均和概率平均两种判决方式,共四种方法进行了测试,分别为:a)年龄矫正+判决平均;b)年龄矫正+概率平均;c)无年龄矫正+判决平均;d)无年龄矫正+概率平均。30次测试结果的平均值如表 2所示。
从表 2中的测试结果可以看出:1)概率平均方式略优于判决平均方式,但是两者的效果接近。2)增加年龄矫正后,诊断准确率可以提高2个百分点左右。其中使用年龄矫正结合概率平均方式可以达到最好的诊断准确率88.02%。
本文在数据预处理过程中采用了5 mm精度的非刚性配准、年龄矫正到70岁和每个MRI提取151幅2.5D图像数据增广方法。本文对这些预处理参数设置的影响进行了测试:1)为了测试矫正年龄的影响,对矫正到65岁、75岁和80岁的准确率进行了测试,结果分别为88.1%、87.92%和88.03%,从该结果可以看出,矫正到其他年龄上具有相似的效果。2)为了测试配准精度的影响,对10 mm配准精度和2.5 mm配准精度的准确率进行测试,结果分别为86.83%和84.15%,说明了5 mm配准精度的效果最佳。3)本文采用数据增广的中心点满足间隔2个体素,可以提取151个中心点。如果满足间隔3个体素,可以提取71个中心点。间隔1个体素可以提取465个中心点。测试71个中心点和465个中心点的准确率,结果分别为87.07%和88.11%,说明了减少中心点数量会导致数据增广效果降低,增加中心点数量对效果有轻微提升,但会增加较多的计算量。
文献[8]同样采用了深度神经网络在ADNI数据库里的数据上进行了诊断测试,为了同其他深度神经网络方法比较,本文将本方法与文献[8]中的使用MRI数据的诊断方法进行比较,结果如表 3所示。由表 3可知,在使用文献[8]同样测试样本的情况下,本文提出的方法比文献[8]使用的堆叠自编码器(Stacked AutoEncoder, SAE)方法和支持向量机(Support Vector Machine, SVM)方法准确率提高了5个百分点以上。虽然文献[8]的方法在MRI样本子集的基础上增加了PET数据后准确率提升到了91.4%,但多个数据源在应用中成本也会相应增加。
上述实验结果表明阿尔兹海默症引起的海马体萎缩信息可以通过多幅2.5D图像的方式提取出来,这些信息可以使用卷积神经网络进行训练和识别,从而达到诊断阿尔兹海默症的目的,而年龄矫正方法可以提高卷积神经网络的识别效果。与文献[8]方法在同样MRI数据的测试比较结果表明,本文方法进行分类的效果相比SAE有较大提升。
3 结语基于阿尔兹海默症引起海马体萎缩的现象,本文提出了一种使用卷积神经网络结合2.5D的数据提取方式,利用海马体区域磁共振图像对阿尔兹海默症患者进行计算机辅助诊断,通过非刚性配准、年龄矫正和数据增广等处理方式,提高了诊断的准确率。最后通过10折交叉验证和多次验证的方式,测得该辅助诊断方法的准确率达到88.02%。本文所提方法仅使用MRI数据,虽然诊断准确率不如多数据源联合诊断方式,但是应用成本相对较低。而对于只使用MRI数据的诊断方式,本文方法的识别准确率相对于使用SAE或SVM的分类方法较高。本文使用训练后的神经网络对阿尔兹海默症进行了识别,说明该神经网络在训练过程中学习到了与阿尔兹海默症相关的海马体形态特征。下一步可采用卷积神经网络的可视化技术,显示并分析这些海马体形态特征,为阿尔兹海默症对海马体影响的病理学研究提供参考。
[1] | 叶玉如. 老年痴呆症——现代脑科学和医学研究面临的严峻挑战[J]. 生命科学, 2014, 26(1): 1. (YE Y R. Alzheimer's disease:the serious challenge of modern mental science and medical science[J]. Chinese Bulletin of Life Sciences, 2014, 26(1): 1. DOI:10.3785/j.issn.1008-9209.2013.07.031) |
[2] | MATSUDA H. MRI morphometry in Alzheimer's disease[J]. Ageing Research Reviews, 2016, 30: 17-24. DOI:10.1016/j.arr.2016.01.003 |
[3] | JIE B, WEE C Y, SHEN D G, et al. Hyper-connectivity of functional networks for brain disease diagnosis[J]. Medical Image Analysis, 2016, 32: 84-100. DOI:10.1016/j.media.2016.03.003 |
[4] | GARALI I, ADEL M, BOURENNANE S, et al. Brain region ranking for 18FDG-PET computer-aided diagnosis of Alzheimer's disease[J]. Biomedical Signal Processing and Control, 2016, 27: 15-23. DOI:10.1016/j.bspc.2016.01.009 |
[5] | TONG T, WOLZ R, GAO Q Q, et al. Multiple instance learning for classification of dementia in brain MRI[J]. Medical Image Analysis, 2014, 18(5): 808-818. DOI:10.1016/j.media.2014.04.006 |
[6] | ZHANG J, GAO Y, GAO Y Z, et al. Detecting anatomical landmarks for fast Alzheimer's disease diagnosis[J]. IEEE Transactions on Medical Imaging, 2016, 35(12): 2524-2533. DOI:10.1109/TMI.2016.2582386 |
[7] | LI F, TRAN L, THUNG K H, et al. A robust deep model for improved classification of AD/MCI patients[J]. IEEE Journal of Biomedical and Health Informatics, 2015, 19(5): 1610-1616. DOI:10.1109/JBHI.2015.2429556 |
[8] | LIU S Q, LIU S D, CAI W D, et al. Multimodal neuroimaging feature learning for multiclass diagnosis of Alzheimer's disease[J]. IEEE Transactions on Biomedical Engineering, 2015, 62(4): 1132-1140. DOI:10.1109/TBME.2014.2372011 |
[9] | KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[C]//Proceedings of the 201225th International Conference on Neural Information Processing Systems. New York:Curran Associates Inc., 2012:1097-1105. http://dl.acm.org/citation.cfm?id=3065386 |
[10] | WYMAN B T, HARVEY D J, CRAWFORD K, et al. Standardization of analysis sets for reporting results from ADNI MRI data[J]. Alzheimer's and Dementia, 2013, 9(3): 332-337. DOI:10.1016/j.jalz.2012.06.004 |
[11] | TONG T, GAO Q Q, GUERRERO R, et al. A novel grading biomarker for the prediction of conversion from mild cognitive impairment to Alzheimer's disease[J]. IEEE Transactions on Biomedical Engineering, 2017, 64(1): 155-165. DOI:10.1109/TBME.2016.2549363 |
[12] | DUKART J, SCHROETER M L, MUELLER K, et al. Age correction in dementia-matching to a healthy brain[J]. PLoS One, 2011, 6(7): e22193. DOI:10.1371/journal.pone.0022193 |
[13] | SHIN H C, ROTH H R, GAO M C, et al. Deep convolutional neural networks for computer-aided detection:CNN architectures, dataset characteristics and transfer learning[J]. IEEE Transactions on Medical Imaging, 2016, 35(5): 1285-1298. DOI:10.1109/TMI.2016.2528162 |
[14] | YAN Z N, ZHAN Y Q, PENG Z G, et al. Multi-instance deep learning:discover discriminative local anatomies for bodypart recognition[J]. IEEE Transactions on Medical Imaging, 2016, 35(5): 1332-1343. DOI:10.1109/TMI.2016.2524985 |
[15] | ROTH H R, LU L, LIU J M, et al. Improving computer-aided detection using convolutional neural networks and random view aggregation[J]. IEEE Transactions on Medical Imaging, 2016, 35(5): 1170-1181. DOI:10.1109/TMI.2015.2482920 |