背景
阿尔茨海默病(Alzheimer’s disease, AD),是老年人常见的一种神经系统退行性疾病,已成为当今威胁老年人健康的重要病症之一。临床主要表现为认知功能障碍,记忆力衰退等。在未来 20 年中,随着世界人口老龄化的加剧,患 AD 的病人数量将可能增加一倍,在 2050 年,有可能每 85 个人中就有一个 AD 患者。
轻度认知障碍(Mild cognitive impairment,MCI)也是一种常见的认知功能衰退疾病,是介于正常衰老和痴呆之间的中间状态,表现为轻度的认知功能减退,但日常能力暂时没有受到明显影响,与正常人相比,MCI 患者成为 AD 患者的几率要高数倍,被认为是 AD 的一个早期阶段,每年都会有 10%~15% 的 MCI 转化成 AD,而当 AD 患者表现出明显的症状时,几乎已经是在中晚期了,因此,MCI 阶段可能是一个最合适的治疗阶段,对于 AD 的早期分类和预测则变得尤为重要。
AD 患者大脑显著的特征有结构的变更,出现β-淀粉样斑块以及代谢速率的减慢。目前,多种模态的生物标记物已经被证实能够鉴别 AD 和 MCI。常见的标记物有:利用结构磁共振成像(MRI)技术测量大脑结构的变化、功能磁共振成像技术测量跟踪脑部代谢速率的变化的图像和通过脑脊液(Cerebrospinal fluid,CSF)中测定特定蛋白的含量变化。
目前,大多数的分类方法仅仅利用一种模态的生物标记物对 AD 和 MCI 进行诊断,但由于单一模态的数据所能提供的信息有限,而多模态数据能够提供更加全面的脑部变化的互补信息,有利于提高分类器的性能,因此将不同模态的生物指标进行联合分析成为了研究的热点。本研究利用一种线性的支持向量机的分类方法,联合多模态的生物指标对 AD、MCI 和正常老年人进行了分类和预测,并取得了良好的效果。
数据与方法
数据库介绍
本文中所使用的神经影像学数据均来自于 Alzheimer’s Disease Neuroimaging Initiative(ADNI)((www.loni.ucla.edu/ADNI)数据库。ADNI 是 2003 年由美国国立老化研究所、 美国生物医学成像和生物工程研究所、 美国食品和药品监督管理局、私营制药公司以及非营利性机构共同投资 6 000 多万美金启动的公私合作项目,旨在测试 MRI、PET 或者其他的生物标记和临床神经心理学指标,是否可以联合起来测量 MCI 和早期 AD 的发展进程。被试是由美国和加拿大的 50 个地点招募而来,最初计划招募 800 名年龄在 55 到 90 岁之间的老年人参与研究,包括认知正常的老年人(200 人,跟踪 3 年),MCI(400 人,跟踪 3 年)以及早期的 AD 患者(200 人,跟踪 2 年)(具体信息请查阅 www.adni-info.org)。
MMSE 是指简易精神状态量表( Mini-Mental State Examination),可用于阿尔茨海默病的筛查,一般 MMSE 分数小于 24 分代表认知功能障碍。CDR 是指临床痴呆评定量表(Clinical Dementia Rating),其结果以 0、0.5、1.0、2.0 和 3.0 分别判定为正常,可疑,轻度,中度,重度痴呆。
本文所选用的被试均同时具有三种模态(分别为 Structural Magnetic Resonance Imaging,sMRI、CSF 和 PET)。共 202 人:AD 组:51 人,男/女 = 33/18,MMSE 得分:20-26,CDR 得分:0.5/1,满足美国国立神经病学及语言障碍和卒中研究会和阿尔茨海默病及相关疾病协会(National Institute of Neurological and Communicative Disorders and Stroke/Alzheimer’s Disease and Related Disorders Association, NINCDS / ADRDA)对 AD 的评定标准;MCI 组:99 人(其中 43 人在 18 个月之后转化成 AD 患者,称为 MCI converters ,MCI-c;56 个人在 18 个月之后未转化成 AD 患者,称为 MCI non-converters, MCI-n),男/女 = 67/32,MMSE 得分:24~30,CDR 得分:0.5,但日常能力暂时没有受到明显影响,通过韦氏记忆量表对其逻辑记忆检测判定其认知功能(校正了受教育程度因素);HC 组(健康受试者):52 人,男/女 = 34/18,MMSE 得分:24-30,CDR 得分:0,没有抑郁,没有痴呆。具体被试信息见表 1。
表 1 受试者信息
方法
1. 首先对不同模态的数据进行相应的预处理,从结构磁共振图像和 PET 图像中各提取出 93 个特征,脑脊液中提取出 3 个特征。
2. 基于以上数据构建线性支持向量机分类器(SVM)。SVM 是基于结构风险最小化的机器学习方法,是一种较好的分类器,通过在特征空间中构建最优分类超平面,将不同类别样本分开,通俗来讲,它是一种二类分类模型 (分类函数),通过决策对一个新的数据进行判别分类。
3. 对不同模态的数据进行分类,计算各自的分类准确率,进行比较。多模态数据融合和分类流程如图 1 所示。
图 1. 多模态数据融合和分类流程示意图
结果
本文通过一种线性支持向量机的分类方法,分别从三种模态中提取了若干个特征作为分类指标对 AD、MCI 和正常人的分类和预测进行研究,结果显示,无论是在 AD vs HC 组中还是 MCI vs HC 组中,使用多模态数据融合方法得到的分类结果均优于所有只使用单模态数据得到的结果。
利用多模态融合数据对两组的分类结果如下:AD vs HC 组,分类准确率为 93.2%、敏感性为 93% 以及特异性为 93.3%(单模态最好的分类准确率为 86.5%)。MCI vs HC 组,分类准确率为 76.4%、敏感性为 81.8% 以及特异性为 66%(单模态最好的分类分类准确率为 72%),其中,关于 MCI-c 受试者的分类准确率为 91.5%,MCI-n 受试者的分类准确率为 73.4%。详细的各个模态数据分类结果见表 2。
表 2 单模态和多模态数据的分类结果比较
AD = Alzheimer's Disease, MCI = Mild Cognitive Impairment, HC = Healthy Control, ACC = classification ACCuracy, SEN = SENsitivity, SPE = SPEcificity.
结论
联合多种模态的生物标记物指标,在对 MCI 和 AD 的早期分类和鉴别过程中都表现出了更高的准确性,为早期 AD 的预测及诊断提供了参考,具有重要意义。
展望
今后,我们可以利用 AD 和 HC 相应的特征信息作为训练样本数据,然后以 MCI 的特征信息作为测试样本数据,构建最优的分类器,以此可以预测 MCI 转化为 AD 的可能性。
参考文献
Multimodal classification of Alzheimer's disease and mild cognitive ,NeuroImage 55 (2011) 856–867