基于脑MRI和机器学习的阿尔茨海默病病程分类研究

基于脑MRI和机器学习的阿尔茨海默病病程分类研究

ID:76133111

大小:1.28 MB

页数:59页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第1页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第2页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第3页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第4页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第5页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第6页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第7页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第8页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第9页
基于脑MRI和机器学习的阿尔茨海默病病程分类研究_第10页
资源描述:

《基于脑MRI和机器学习的阿尔茨海默病病程分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

分类号:R338学校代码:10114密级:学号:041510520硕士学位论文基于脑MRI和机器学习的阿尔茨海默病病程分类研究ClassificationofAlzheimer’sDiseaseprogressionbasedonbrainMRIandMachineLearning研究生:齐雪丹指导教师:范炤副教授专业名称:神经生物学研究方向:计算神经生物学学位类型:学术学位所在学院:基础医学院中国山西二〇一八年六月五日 分类号:R338学校代码:10114密级:学号:041510520基于脑MRI和机器学习的阿尔茨海默病病程分类研究ClassificationofAlzheimer’sDiseaseprogressionbasedonbrainMRIandMachineLearning研究生:齐雪丹指导教师:范炤副教授专业名称:神经生物学研究方向:计算神经生物学学位类型:学术学位所在学院:基础医学院中国山西二〇一八年六月五日 学位论文独创性声明本人声明,所呈交的学位论文系在导师范炤副教授指导下,本人独立完成的研究成果。文中任何引用他人的成果,均已做出明确标注或得到许可。论文内容未包含法律意义上已属于他人的任何形式的研究成果,也不包含本人已用于其他学位申请的论文或成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本文如违反上述声明,愿意承担以下责任和后果:1、交回学校授予的学位证书;2、学校可在相关媒体上对作者本人的行为进行通报;3、本文按照学校规定的方式,对因不当取得学位给学校造成的名誉损害,进行公开道歉;4、本人负责因论文成果不实产生的法律纠纷。论文作者签名:日期:年月日学位论文版权使用授权书本人完全了解山西医科大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权山西医科大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。本人离校后发表或使用学位论文或与该论文直接相关的学术论文或成果时,署名单位仍然为山西医科大学。(保密论文在解密后应遵守此规定)论文作者签名:日期:年月日指导教师签名:日期:年月日(本声明的版权归山西医科大学所有,未经许可,任何单位及任何个人不得擅自使用) 目录中文摘要................................................................................................................................I英文摘要.............................................................................................................................IV常用缩写词中英文对照表................................................................................................VII前言...................................................................................................................................11研究对象的选取............................................................................................................31.1研究对象.................................................................................................................31.2入选标准.................................................................................................................31.3ADNI数据库..........................................................................................................31.4人口统计学资料.....................................................................................................42数据预处理.....................................................................................................................62.1MRI检测及数据预处理..........................................................................................62.2MRI数据进行特征选择..........................................................................................72.3MRI数据特征选择结果.........................................................................................73机器学习模型...............................................................................................................123.1机器学习理论.......................................................................................................123.2本课题涉及到的几种机器学习算法...................................................................123.3机器学习算法实现过程.......................................................................................164结果...........................................................................................................................194.1CN-EMCI-LMCI-AD两两分类结果仿真图........................................................194.2CN-EMCI的预测结果..........................................................................................214.3CN-LMCI的预测结果..........................................................................................224.4CN-AD的预测结果..............................................................................................234.5EMCI-LMCI的预测结果......................................................................................234.6EMCI-AD的预测结果..........................................................................................244.7LMCI-AD的预测结果..........................................................................................254.8SVM与RF的预测结果比较................................................................................255讨论...........................................................................................................................27 5.1MCI、AD的MRI特征指标分析........................................................................275.2CN-EMCI-LMCI-AD两两分类结果比较............................................................285.3RF分类器..............................................................................................................296结论...........................................................................................................................30参考文献.............................................................................................................................31综述.................................................................................................................................36致谢.................................................................................................................................45在学期间承担/参与的科研课题与研究成果....................................................................46个人简历.............................................................................................................................47 山西医科大学硕士学位论文基于脑MRI和机器学习的阿尔茨海默病病程分类研究摘要目的:探讨轻度认知功能障碍(mildcognitiveimpairment,MCI)和阿尔茨海默病(Alzheimer’sdisease,AD)脑核磁共振成像(Magneticresonanceimaging,MRI)的特征指标,并将MRI特征指标进入机器学习进行AD病程分类预测,从而选出分类预测的最佳模型,用于MCI、AD的辅助诊断。方法:1.随机选取阿尔茨海默病神经影像计划(Alzheimer’sDiseaseNeuroimagingInitiative,ADNI)数据库中编号为4018~5210的符合条件的研究对象543例,根据ADNI诊断标准对研究对象进行分组:认知功能正常(cognitivenormal,CN)组139例,早期轻度认知功能障碍(earlymildcognitiveimpairment,EMCI)组220例,晚期轻度认知功能障碍(latemildcognitiveimpairment,LMCI)组108例,AD组76例。收集研究对象的资料:姓名、性别、年龄、受教育程度、简易精神状态评价量表(MiniMentalStateExamination,MMSE)和脑MRI资料。2.采用Philips3.0TMRI扫描,调整MRI扫描参数,射频重复时间(TR)6.8ms,回波时间(TE)3.1ms,翻转角(FA)9°,视野大小(FOV):RL=204mm/AP=240mm/FH=256mm,层厚为1.2mm,层数170,体素:1mmx1mmx1.2mm。之后对MRI进行预处理:空间标准化、图像平滑和分割。最终获得272项MRI特征指标,49项皮层下体积(subcorticalvolumes,SV)、69项皮层体积(corticalvolumes,CV)、70项表面积(surfaceareas,SA)、68项皮层厚度(corticalthicknesses,TA)和16项海马亚区体积(hippocampalsubfields,HS)。3.272项MRI原始指标进行特征选择,具体方法是将所有指标首先进行正态性和方差齐性检验,对于满足条件的MRI指标进行单因素方差分析及LSD-t多重比较,I 山西医科大学硕士学位论文不符合条件的指标则进行非参数检验及多个样本两两比较的Nememyi法检验,最终获得CN、EMCI、LMCI、AD组间两两比较均有显著性差异的MRI特征指标28项。然后将28项MRI指标与MMSE进行多元线性回归分析,自变量选择方法选用逐步回归法,α入0.05及α出0.10作为检验水准参数,获得5项指标。4.272项原始MRI指标、28项指标、5项指标、SV、CV、SA、TA、HS进入机器学习算法对AD不同疾病进程进行分类预测。本研究引入四种机器学习算法,随机森林(randomforest,RF),决策树(decisiontree,DT),支持向量机(SupportVectorMachine,SVM),K近邻(k-NearestNeighbor,KNN)。将不同的MRI指标放入四种机器学习算法中对CN-EMCI-LMCI-AD进行两两分类预测,通过十折交叉验证来测试算法的准确性,比较预测准确率、灵敏度、特异度、ROC曲线下的面积(AreaUnderROCCurve,AUC),综合评价预测模型,选出疾病的最佳分类模型。结果:1.CN-AD分类准确率最高,其次为EMCI-AD,CN-LMCI,LMCI-AD,EMCI-LMCI,CN-EMCI分类准确率较低。RF、SVM、KNN、DT在CN-EMCI分类的最高预测准确率分别为77.78%、65.28%、59.72%、61.11%;在CN-LMCI分类的最高预测准确率为88.00%、75.60%、71.60%、70.80%;在CN-AD分类的最高预测准确率为96.45%、90.90%、89.55%、88.18%;在EMCI-LMCI分类的最高预测准确率为81.82%、71.21%、67.58%、64.58%;在EMCI-AD分类的最高预测准确率为90.00%、86.67%、84.33%、81.67%;在LMCI-AD分类的最高预测准确率为84.21%、72.78%、65.56%、68.89%。2.RF分类器分类效果最好,优于SVM、KNN、DT的分类结果。从CN-EMCI-LMCI-AD两两分类结果看出,RF分类准确率最高,其次为SVM。RF与SVM的AUC值比较,在CN-AD分类中,RF的AUC值为0.98,SVM为0.95;在LMCI-AD分类中,RF的AUC值为0.91,SVM为0.57;在CN-LMCI分类中,RF的AUC值为0.84,SVM为0.73;在EMCI-AD分类中,RF的AUC值为0.88,SVM为0.72;在EMCI-LMCI中,RF的AUC值为0.74,SVM为0.60。在CN-EMCI分类中,RF的AUC值为0.57,SVM为0.52。可见,RF作为分类器分类效果最好。II 山西医科大学硕士学位论文3.28项MRI指标作为分类特征,分类效果最好。272项MRI指标、28项指标、5项指标、SV、CV、SA、TA、HS进入四种机器学习算法对CN-EMCI、CN-LMCI、CN-AD、EMCI-LMCI、EMCI-AD、LMCI-AD进行两两分类。CN-EMCI中,除了5项指标在DT的预测准确率最高,其余三种分类器的最高预测准确率均发生在28项指标。CN-LMCI中,5项指标在SVM、DT的预测准确率最高,28项指标在RF、KNN的预测准确率最高。CN-AD、EMCI-AD中四种分类器的最高预测准确率均发生在28项指标。EMCI-LMCI中,SA在SVM的预测准确率最高,5项指标在KNN的预测准确率最高。28项指标在RF、DT的预测准确率最高。LMCI-AD中,28项指标在SVM、RF准确率最高,5项指标在DT准确率最高,KNN的5项和28项指标预测结果一样。由于RF的预测准确率最高,并且RF在所有分类中基于28项指标的预测结果最好。因此,28项指标作为分类特征分类效果最好。结论:1.RF分类器对AD的不同疾病进程预测效果最好。2.28项MRI指标作为分类特征预测效果最好。3.RF分类器对CN-EMCI-LMCI-AD的两两分类预测结果都优于其他分类器,其中CN-AD的预测结果最好。RF分类器有效地提高了MCI/AD的自动诊断效率,可对AD早期不同阶段进行分类预测,用于辅助诊断AD。关键词:核磁共振成像;机器学习;随机森林;阿尔茨海默病;轻度认知功能障碍III 山西医科大学硕士学位论文ClassificationofAlzheimer’sDiseaseprogressionbasedonbrainMRIandMachineLearningAbstractObjective:ToinvestigatethecharacteristicsofbrainMagneticresonanceimaging(MRI)ofmildcognitiveimpairment(MCI)andAlzheimer'sdisease(AD)andtoutilizeMachineLearningonMagneticresonanceimaging(MRI)forclassificationofAlzheimer’sDiseaseprogression.Methods:1.Randomlyselected543casesofAlzheimer'sDiseaseNeuroimagingInitiative(ADNI)databasenumberedfrom4018to5210.ThesubjectsweredividedintofourgroupsaccordingtoADNIdiagnosticcriteria:cognitivenormal(n=139),earlymildcognitiveimpairment(EMCI)(n=220),latemildcognitiveimpairment(LMCI)(n=108)andAD(n=76).Thesecontentsarecollected:name,gender,age,educationlevel,MiniMentalStateExamination(MMSE)andMRI.2.TheMRIscanparameterswereadjustedwiththePhilips3.0TMRIscanner.TheRFrepetitiontime(TR):6.8ms,theechotime(TE):3.1ms,theflipangle(FA):9°andthefieldofview(FOV)AP=240mm/FH=256mm,layerthicknesswas1.2mm,layerswere170,voxel:1mm×1mm×1.2mm.PretreatmenttheMRI:spatialstandardization,smooth,braintissuesegmentation.272MRIfeatureswereobtained,49subcorticalvolumes(SV),69corticalvolumes(CV),70surfaceareas(SA),68corticalthicknesses(TA),And16hippocampalsubfields(HS).3.The272primaryfeaturesofMRIwereselectedbyOne-wayANOVA,LSD-tmultiplecomparisonsiftheindicatorsweresatisfiedwithnormalityandhomogeneityofIV 山西医科大学硕士学位论文variancetest.ifnot,ChoosednonparametrictestandNememyitest.28indexeshadsignificantdifferencesbetweengroups.Andthen28MRIindexeswereputintomultivariatelinearregressionanalysisofMMSE.Thestepwiseregressionmethod、αin0.05、αout0.10wereselectedandfiveindexeswereobtained.4.272originalMRIindexes,28indexes,5indexes,SV,CV,SA,TA,HSclassifiedandpredictedtheprogressofADwerebasedonMachineLearning.FourMachineLearningalgorithms,randomforest(RF),decisiontree(DT),SupportVectorMachine(SVM)andk-nearestneighbor(KNN)wereintroducedintothisstudy.DifferentMRIindexeswereputintothefouralgorithmstopredicttheaccuracyofCN-EMCI-LMCI-AD.Theaccuracyofprediction,sensitivity,specificity,AreaUnderROCCurve(AUC)couldJudgeoutagoodclassificationpredictionmodel.Results:1.TheaccuracyofCN-ADclassificationwasthehighest,EMCI-AD,CN-LMCI,LMCI-AD,EMCI-LMCIrankedinthemiddle,andCN-EMCIshowedthelowestclassificationaccuracy.ThehighestpredictionaccuracyofRF,SVM,KNNandDTforCN-EMCIclassificationwere77.78%,65.28%,59.72%and61.11%;88.00%,75.60%,71.60%,and70.80%forCN-LMCI;96.45%,90.90%,89.55%and88.18%forCN-AD;81.82%,71.21%,67.58%and64.58%forEMCI-LMCI;90.00%,86.67%,84.33%,81.67%forEMCI-AD;84.21%,72.78%,65.56%and68.89%forLMCI-AD.2.RFhadthebestclassificationresultinallfourMachineLearningclassifiers.AccordingtotheresultsofCN-EMCI-LMCI-ADclassification,RFhadthehighestaccuracy.TheAUCvalueofRFwas0.98andSVMwas0.95forCN-ADclassification;0.91and0.57forLMCI-AD;0.84and0.73forCN-LMCI;0.88and0.72forEMCI-AD;0.74and0.60forEMCI-LMCI.0.57and0.52forCN-EMCI.RFworkedbest.3.28MRIindicatorshadthebestclassificationasclassificationfeatures.V 山西医科大学硕士学位论文PutMRIindicatorsintoMachineLearningtoclassifytheprogressionofAD.ForCN-EMCI,5indicatorshadthehighestaccuracyinDT,28indicatorsintheremainingthreekindsofClassifiers;ForCN-LMCI,5indicatorsinSVMandDT,28indicatorsinRFandKNN.ForCN-AD、EMCI-AD,28indicatorsinallclassifiers.ForEMCI-LMCI,SAinSVM,5indicatorsinKNN,28indicatorsinRFandDT.ForLMCI-AD,28indicatorsinSVM、RF,5indicatorsinDT,5indicatorsand28indicatorsinKNN.RFshowedthebestresultson28indicators.Therefore,28indicatorshadthebestclassificationasclassificationfeatures.Conclusion:1.TheRFclassifierhadthebestpredictiveresultfordifferentdiseaseprocessesinAD.2.28MRIindicatorshadthebestpredictiveeffectastheclassificationcharacteristics.3.TheRFclassifiersaresuperiortootherclassifiersforCN-EMCI-LMCI-AD,andCN-ADhadthebestpredictionresult.TheRFclassifiereffectivelyimprovedtheefficiencyofautomaticdiagnosisofMCI/AD,andcouldbeusedtodiagnosisADassistively.Keywords:Magneticresonanceimaging;MachineLearning;RandomForest;Alzheimerdisease;MildcognitiveimpairmentVI 山西医科大学硕士学位论文常用缩写词中英文对照表英文缩写英文名称中文名称MLMachineLearning机器学习DTdecisiontree决策树RFRandomForest随机森林KNNK-NearestNeighborK近邻SVMsupportvectormachines支持向量机MRIMagneticresonanceimaging核磁共振成像ADAlzheimer’sDisease阿尔茨海默病Alzheimer’sDiseaseNeuroimagingADNI阿尔茨海默病神经影像计划InitiativeMMSEMiniMentalStateExamination简易精神状态评价量表CNcognitivenormal认知功能正常MCImildcognitiveimpairment轻度认知功能障碍EMCIearlymildcognitiveimpairment早期轻度认知功能障碍LMCIlatemildcognitiveimpairment晚期轻度认知功能障碍SVsubcorticalvolumes皮层下体积CVcorticalvolumes皮层体积TAcorticalthicknesses皮层厚度SAsurfaceareas表面积HShippocampalsubfields海马亚区体积VII 山西医科大学硕士学位论文前言阿尔茨海默病(Alzheimer’sdisease,AD)是一种慢性进行性发展的中枢退行性病变,是痴呆中最常见的类型。调查显示2015年全球痴呆患者已达4680万人,到2050年数量将达到1亿3150万,其中2/3为AD患者,平均每66秒就有一新增病例[1]。AD严重威胁了人类的健康,临床主要表现为记忆减退、认知功能出现障碍以及伴有其他精神和行为障碍。AD的主要病理改变为β淀粉样蛋白(amyloidβ-protein,Aβ)沉积形成的老年斑(senileplaques,SPs)和tau蛋白过度磷酸化导致的细胞内神经原纤维缠结(neurofibrillarytangles,NFTs),并且可伴随颗粒空泡变性、平野小体以及脑血[2,3]管的改变。目前临床诊断主要依靠神经量表评分,确诊仍需脑组织活检。由于缺乏客观的生物学标志以及具有一定的主观性,当病人出现明显的症状时,病情已非常严重,至今没有有效的治疗方法。轻度认知功能障碍(mildcognitiveimpairment,MCI)是处于AD和正常老年人之间可向AD进展的过渡阶段。虽然目前对MCI尚无明确的定义,但从2011年美国国立老龄研究院推荐的AD新指南中可看出,MCI为AD发展中的一个重要阶段。与正常人相比,MCI患者成为AD患者的几率要高数倍。一些MCI患者采取恰当的[4]措施甚至可以恢复到正常认知状态。若早期未及时发现MCI,6年后转化为AD的[5][6]几率高达80%,且2/3的AD患者由MCI转化而来。MCI患者是AD的高危人群,因此对MCI的诊断和预测是及时发现早期AD的关键。如何能准确地区分MCI和AD,成为近年来的研究热点,因而对MCI的预测研究有着非常重要的意义。尽管近年来多种影像新技术被应用于AD的辅助诊断研究中,但目前核磁共振成像(Magneticresonanceimaging,MRI)仍然是一种能够协助临床早期诊断AD的有[7]效辅助手段,MRI作为一项重要的非侵入性检测AD的诊断工具,可用来区分AD和[8][9]其他痴呆,也可独立预测痴呆的进展。MCI/AD病人会有脑组织结构的萎缩,而正常的衰老也可出现脑萎缩,如何对脑结构的变化做出正确判断将有助于诊断出MCI、AD。目前AD的MRI诊断主要是通过影像医生的主观阅片,此方法费时费力及存在一定的主观性,会影响对AD的准确判断。如何运用计算机对MRI进行自动准确地分类,进而识别AD及AD早期阶段,成为了现阶段研究的热点。1 山西医科大学硕士学位论文机器学习(MachineLearning,ML)是一门涉及多领域的交叉学科,它是人工智能的核心。如何将计算机技术充分有效地应用到医疗领域成为了当今国内外的研究热点。通过利用计算机构建疾病预测模型已成为一种趋势,其中不乏对AD构建预测模型。有研究基于海马体与内嗅皮层体积通过利用支持向量机(supportvectormachines,SVM)分类方法对CN-MCI、CN-AD、MCI-AD进行两两分类,分类准确率分别为76%、82.0%、58.3%,当选择高维模式进行分类时,分类准确率高达81.8%、94.3%、[10]74.3%。有研究选择双侧海马体积和所有组别脑区中具有明显区别的低频振幅值作为分类特征,采用Adaboost集成分类方法对MCI、AD及正常对照组的MRI数据进行两两分类,分类准确率分别达71.15%、69.64%、78.57%,当引入性别、年龄等因[11]素后,分类准确率有所提高。可见,基于高维模式分类或集成分类方法对AD预测已成为一种趋势。随机森林(RandomForest,RF)作为“代表集成学习技术水平的方法”,在处理高维数据上展现出独特的优势。因此本研究首选RF对AD早期阶段进行分类预测。大量的研究证明RF作为一个组合分类器具有很高的预测准确率,对异常值及噪[12]声都具有很好的容忍度,并且不容易出现过拟合。RF作为一种有效的预测工具,抗噪声能力效果好,处理数据的能力强,离散型数据和连续型数据均可处理,并在处理高维数据上有独特的优势。总之RF简单、容易实现,以及计算开销小。因此,本研究优先选择RF作为分类器进行AD的分类研究。由于RF实质上是由很多棵决策树(decisiontree,DT)组成的,因此本研究也引入DT作为分类器与RF做对比。基[13,14][15][16]于目前现有的研究多采用海马体、海马旁回和内嗅皮层、颞叶内侧进行预测,这些MRI分类指标大多是基于经验直接选取的,且预测能力有限,预测准确率不高。本研究并非直接选取上述病变部位,而是首先对大量MRI数据进行降维,将属性约简后的特征进入RF、SVM、DT、K近邻(K-NearestNeighbor),采用十折交叉验证进行模型评估,从而选出最优模型,协助疾病早期诊断。2 山西医科大学硕士学位论文1研究对象的选取1.1研究对象本课题研究对象来自于美国阿尔茨海默病神经影像计划(Alzheimer’sDiseaseNeuroimagingInitiative,ADNI)数据库。随机从编号4018~5210中选取符合要求的研究对象543例,分成四组:认知功能正常(cognitivenormal,CN)组139人,早期轻度认知功能障碍(earlymildcognitiveimpairment,EMCI)组220人,晚期轻度认知功能障碍(latemildcognitiveimpairment,LMCI)组108人和AD组76人。1.2入选标准根据ADNI标准,接受教育(或参加工作)不得少于6年、且均符合各组诊断标准的60-90岁的研究对象入选;要求受试者体内不含MRI检查的禁忌物品;受试期间不允许参与其他试验;签署知情同意书。各组入选标准:(1)CN组:年龄、性别及受教育水平均匹配的正常认知老年组;无记忆力下降(且排除生理性健忘);MMSE量表评分(24-30分);临床痴呆评定量表(clinicaldementiarating,CDR)(0分);认知功能正常,没有MCI和痴呆;基本日常活动没有障碍。(2)EMCI组:年龄范围在60岁至90岁;教育程度达到初中毕业水平及以上;MMSE量表得分为24-30分;逻辑记忆量表进行测试:受教育程度≥16年(得分为9-11分),8-15年(5-9分),0-7年(3-6分);CDR为0.5,且没有其他认知障碍;基本日常活动无障碍,没有发生痴呆。(3)LMCI组:同EMCI,区别是受教育程度≥16年(≤8分),8-15年(≤4分),0-7年(≤2分)。(4)AD组:MMSE量表评分为20-26分;CDR得分为0.5或1.0;根据NINCDS/ADRDA新标准诊断为AD。1.3ADNI数据库3 山西医科大学硕士学位论文[17]课题研究资料源自于ADNI数据库。ADNI是综合神经心理学测试、影像学检测、脑脊液等多种方法开展的多中心研究。ADNI最初目标是发现更灵敏和精确的诊断方法,能在疾病更早期检测出AD高危人群,并通过有效的生物学标志物标记疾病[18]进展。ADNI研究包括三个阶段:ADNI1、ADNIGO和ADNI2。ADNI1作为ADNI第一阶段,开始于2004年10月,结束于2010年10月1日。[18]是由美国Weiner教授主持,57所研究中心共同完成。ADNI1的突出成果在于通过[19]随访研究成功地获得了AD不同阶段的诊断模型,并重点阐释了AD早期病理变化特征,即Aβ、tau蛋白引起的神经元损伤以及脑结构的改变,并且源自于脑脊液的Aβ1~42或Aβ检测显像最敏感。ADNIGO是继ADNI1后在美国国立卫生研究院(NIH)Go基金资助下进行的为期两年的研究,该研究对MCI的定义做了阐释,并认为EMCI、LMCI可通过相关指标可以区分,这使得AD的研究向前推进了一步。EMCI作为非常轻度的认知功能障碍,介于CN与LMCI之间。因此对于LMCI而言,EMCI的预测将会更有挑战性。ADNI2是在ADNI1和ADNIGO的基础上,对之前获得的结果进行校正和更新。此期将匹兹堡复合物B纳入PET显像中,今后还将有更多的生物标志物被用于AD[20]的早期诊断。1.4人口统计学资料收集的人口统计学资料有:性别、年龄、受教育程度、MMSE及MRI。年龄、受教育程度、MMSE这三组数据首先进行正态性检验、方差齐性检验,对于满足条件者采用单因素方差分析。取α=0.05作为检验水准,P≤0.05可认为差异有统计学意义,进一步进行组间多重比较。统计描述中符合正态性和方差齐性的资料,用均数±标准差表示,否则用中位数±四分位数间距表示。对于性别组采用行×列表资料的卡方检验进行分析,所有操作均在IBMSPSSStatistics21软件上实现。研究对象人口统计学资料分析结果见表1-1。表1-1研究对象人口统计学资料分析CNEMCILMCIADP数量13922010876-性别(女/男)73/66102/11850/5832/440.485年龄73.56±6.0169.93±6.9671.01±7.7575.12±7.77<0.0014 山西医科大学硕士学位论文受教育程度16.41±2.5016.03±2.6616.41±2.7315.94±2.610.343MMSE29.07±1.14628.45±1.5127.64±1.7922.89±2.03<0.001表1-1中,年龄、受教育程度、MMSE数据符合正态性和方差齐性(P>0.05),则可用单因素方差分析,统计描述采用均数±标准差。受教育程度经单因素方差分析F=1.113,P=0.343,P>0.05,尚不能认为CN、EMCI、LMCI、AD四组间的受教育程度有差异。性别组在四组间有无差异是通过行×列表资料的卡方检验进行分析,由于最小期望计数为35.97,获得pearson卡方检验值为2.462,P=0.485,尚不能认为性别(女/男)在CN、EMCI、LMCI、AD四组间分布不同。年龄、MMSE的P值均小于0.001,进一步进行组间多重比较,选用最小显著差异(LSD-t检验)进行两两比较,结果见表1-2。表1-2LSD-t检验结果P组别年龄MMSECN/EMCI0.0000.000CN/LMCI0.0050.000CN/AD0.0200.000EMCI/LMCI0.1890.001EMCI/AD0.0000.001LMCI/AD0.0010.000表1-2显示,MMSE在CN、EMCI、LMCI、AD四组间两两比较的P值均小于或等于0.001。年龄在EMCI与LMCI组间P=0.189>0.05,尚且不能认为EMCI与LMCI组的年龄有差异,这可能由于EMCI与LMCI这两个疾病阶段比较接近,界限不是很清晰,导致发病年龄相近。其余组间比较P值均小于0.05。5 山西医科大学硕士学位论文2数据预处理2.1MRI检测及数据预处理2.1.1MRI检测Philips3.0TMRI进行全脑扫描。合理选择MRI参数以确保图像的质量。数据采集参数设置如下:射频重复时间(TR):磁共振扫描全脑一次的时间。扫描时间越短,所需要扫描的层数就越少,得到的信噪比就低,TR参数为6.8ms。回波时间(TE):从首个射频脉冲放射开始到回波信号采集所需要的时间,TE参数为3.1ms。翻转角(FA):受到射频脉冲信号激发后质子总磁矩旋进角度加大,角度增加值即为FA,FA参数为9°。视野大小(FOV):RL=204mm/AP=240mm/FH=256mm。层厚参数为1.2mm,层数设置为170,体素参数为1mm×1mm×1.2mm。2.1.2MRI数据预处理方法(1)空间标准化由于个体大脑存在着差异,因此不能进行批量处理,不能使用标准模板对每个被试脑组织进行特征提取。这就需要采用Freesurfer软件(http://surfer.nmr.mgh.harvard.edu)进行空间标准化来消除个体差异的影响,将所有被试的同一个脑区位置对应起来配准到标准脑模板上,用所采集到的MRI平均以后的图谱作为模板。(2)图像平滑平滑可减少噪音干扰。由于原始图像不是很清晰,平滑可提高图像的清晰度。场强是否均匀会影响到灰度,从而对脑组织分割影响很大。这就需要对不均匀场进行校正。将图像分割成若干子图像,彼此相邻区域有一半的重叠,将灰度值图中的最大值作为子图白质的参考值,并将非脑组织信号和噪音信号去掉。(3)分割不同的脑模板对图像进行分割所得到的脑组织特征有所差异。用灰度图像来进行预分割,然后几何信息进行精细分割。通过不同亮度对各部分图像进行调制,图像经调制后能够体现出组织体积的改变情况。6 山西医科大学硕士学位论文通过上述过程,获得272项MRI属性。69项皮层体积(corticalvolumes,CV)、49项皮层下体积(subcorticalvolumes,SV)、68项皮层厚度(corticalthicknesses,TA)、70项表面积(surfaceareas,SA)和16项海马亚区体积(hippocampalsubfields,HS)。2.2MRI数据进行特征选择本研究对272项属性进行特征选择,首先进行正态性和方差齐性检验,对符合正态性、方差齐性的数据进行单因素方差分析,采用最小显著差异(leastsignificantdifference,LSD-t)进行组间比较。对于不满足正态性及方差齐性检验的数据,采用非参数检验,本研究中非参数检验采用完全随机设计多个样本比较的Kruskal-WallisH检验,将四组间总体上有统计学差异的特征进行多个独立样本两两比较的Nememyi法检验,之后将所有经过组间多重比较且在组间均有显著性差异的MRI特征数据进行多元线性回归分析。取α=0.05作为检验水准,P≤0.05可认为差异有统计学意义,在IBMSPSSStatistics21软件上实现操作。2.3MRI数据特征选择结果2.3.1272项MRI原始特征指标本研究最开始获得272项原始MRI特征指标,包括CV(69项)、SV(49项)、3TA(68项)、SA(70项)和HS(16项)。CV、SV、HS单位是mm,TA单位是2mm,SA单位是mm。2.3.2单因素方差分析、非参数检验、LSD-t多重比较结果单因素方差分析、LSD-t多重比较,获得CN、EMCI、LMCI、AD四组间两两比较均有差异的指标8项,HS区:CA2-3(左右)、CA4-DG(左右)、前下托(左右),以及CV区的颞下回(左右)。非参数检验及多个独立样本两两比较,获得组间有差异的指标20个,即SV区:杏仁核(左右)、海马(左右)、侧脑室下角(左右);CV区:右内嗅皮层、右颞下回;TA:颞极(左右)、内嗅皮层(左右)、左梭状回、颞下回(左右)、左颞上回、右颞中回;HS:右CA1、海马下托(左右)。7 山西医科大学硕士学位论文因此,272项MRI原始指标经参数检验、非参数检验及样本间多重比较,共获得组间两两比较均有差异的指标28项,数据结果见表2-1。表2-128项MRI特征指标比较MRI指标CNEMCILMCIAD3CV-左颞下回(mm)10136.50±1172.659746.28±1311.329119.02±1458.428053.03±1832.233CV-右颞下回(mm)10128.63±1073.129702.58±1297.069283.65±1250.468379.12±1251.243HS-左CA2-3(mm)922.05±113.70874.68±111.97825.14±128.73752.99±110.583HS-右CA2-3(mm)980.83±114.21931.59±124.37874.46±133.30814.52±134.643HS-左CA4-DG(mm)521.37±61.47495.40±61.68464.70±71.21418.30±60.263HS-右CA4-DG(mm)545.14±63.50520.04±68.44484.81±70.01444.36±70.063HS-左海马前下托(mm)439.81±58.07413.76±63.66371.61±69.71321.30±54.453HS-右海马前下托(mm)424.83±58.61405.77±61.70364.99±56.83324.84±54.923SV-左杏仁核(mm)1418.25±185.801336.00±220.601240.97±215.321063.41±159.713SV-右杏仁核(mm)1465.60±172.631396.36±221.301302.94±213.501171.27±203.243SV-左海马(mm)3721.62±397.233505.61±458.783210.69±529.062872.81±411.703SV-右海马(mm)3810.78±380.653581.60±461.583268.23±524.562985.86±458.203SV-左侧脑室下角(mm)615.28±407.48838.69±454.451108.53±667.681488.09±906.443SV-右侧脑室下角(mm)504.88±364.19717.76±471.11940.46±569.471223.36±768.893CV-右内嗅皮层(mm)1863.96±354.961770.50±353.621579.87±385.061453.26±351.063CV-左颞下回(mm)10128.63±1073.129702.58±1297.069283.65±1250.468379.12±1251.24TA-左颞极(mm)3.63±0.283.52±0.353.42±0.393.23±0.47TA-右颞极(mm)3.69±0.313.59±0.353.46±0.443.25±0.48TA-左内嗅皮层(mm)3.47±0.313.37±0.393.15±0.472.69±0.49TA-右内嗅皮层(mm)3.63±0.353.50±0.473.29±0.512.91±0.51TA-左梭状回(mm)2.69±0.152.63±0.172.57±0.192.46±0.24TA-左颞下回(mm)2.76±0.152.71±0.182.64±0.222.51±0.26TA-右颞下回(mm)2.82±0.162.75±0.192.71±0.192.57±0.23TA-左颞上回(mm)2.65±0.142.59±0.172.51±0.192.43±0.19TA-右颞中回(mm)2.83±0.132.79±0.172.74±0.182.63±0.203HS-左海马下托(mm)594.62±66.51567.30±73.21509.68±81.54451.31±69.283HS-右海马下托(mm)585.11±63.98562.19±74.36506.35±76.50460±71.313HS-右CA1(mm)328.93±33.95320.65±36.19310.18±37.83295.25±41.398 山西医科大学硕士学位论文由于此表格中28项特征指标是经多重比较得出的组间有显著性差异的指标,且P值均小于0.001,因此P值在表格中不再呈现。统计描述用均数±标准差或中位数±四分位数间距表示,参数检验用前者,非参数检验用后者。同时发现28项指标呈现出一定的规律,即除个别脑区为一侧部位,大部分的脑区为左右对称部位。除6项MRI指标(CV-右内嗅皮层,CV-右颞下回,TA-左梭状回,TA-左颞上回,TA-右颞中回,HS-右CA1)外,其余指标均分布在脑左右对称部位,共11对(CV-颞下回,HS-CA2-3,HS-CA4-DG,HS-海马前下托,HS-海马下托,SV-杏仁核,SV-海马,SV-侧脑室下角,TA-颞极,TA-内嗅皮层,TA-颞下回)。并且也可看出,随疾病进展,除侧脑室下角不断扩大外,其余MRI指标逐渐下降,说明脑逐渐萎缩。2.3.3左右脑区配对比较分析结果将上述11对MRI数据进行配对比较,包括配对样本t检验和配对样本比较的Wilcoxon符号秩检验。参数检验用前者,非参数检验用后者。配对结果见表2-2。表2-2配对比较分析结果特征左侧右侧PCN10136.50±1172.6510128.63±1073.120.94EMCI9746.28±1311.329702.58±1297.060.583CV-颞下回(mm)LMCI9119.02±1458.429283.65±1250.460.37AD8053.03±1832.238379.12±1251.240.75CN922.05±113.70980.83±114.21<0.01EMCI874.68±111.97931.59±124.37<0.013HS-CA2-3(mm)LMCI825.14±128.73874.46133.30<0.01AD752.99±110.58814.52±134.64<0.01CN521.37±61.47545.14±63.50<0.01EMCI495.40±61.68520.04±68.44<0.013HS-CA4-DG(mm)LMCI464.70±71.21484.81±70.01<0.01AD418.30±60.26444.36±70.06<0.01CN439.81±58.07424.83±58.610.10EMCI413.76±63.66405.77±61.700.093HS-前下托(mm)LMCI371.61±69.71364.99±56.830.17AD321.30±54.45324.84±54.920.51CN1418.25±185.801465.60±172.63<0.013SV-杏仁核(mm)EMCI1336.00±220.601396.36±221.30<0.019 山西医科大学硕士学位论文LMCI1240.97±215.321302.94±213.50<0.01AD1063.41±159.711171.27±203.24<0.01CN3721.62±397.233810.78±380.65<0.013EMCI3505.61±458.783581.60±461.58<0.01SV-海马(mm)LMCI3210.69±529.063268.23±524.560.04AD2872.81±411.702985.86±458.200.01CN615.28±407.48504.88±364.19<0.01EMCI838.69±454.45717.76±471.11<0.013SV-侧脑室下角(mm)LMCI1108.53±667.68940.46±569.47<0.01AD1488.09±906.441223.36±768.89<0.01CN3.63±0.283.69±0.31<0.01EMCI3.52±0.353.59±0.35<0.01TA-颞极(mm)LMCI3.42±0.393.46±0.440.17AD3.23±0.473.25±0.480.66CN3.47±0.313.63±0.35<0.01EMCI3.37±0.393.50±0.47<0.01TA-内嗅皮层(mm)LMCI3.15±0.473.29±0.51<0.01AD2.69±0.492.91±0.51<0.01CN2.76±0.152.82±0.16<0.01EMCI2.71±0.182.75±0.19<0.01TA-颞下回(mm)LMCI2.64±0.222.71±0.19<0.01AD2.51±0.262.57±0.230.03CN594.62±66.51585.11±63.980.02EMCI567.30±73.21562.19±74.360.093HS-海马下托(mm)LMCI509.68±81.54506.35±76.500.50AD451.31±69.28460.00±71.310.16配对比较结果显示,HS-CA2-3、HS-CA4-DG、SV-杏仁核、SV-海马、SV-侧脑室下角、TA-内嗅皮层、TA-颞下回这7对MRI数据在CN/EMCI/LMCI/AD的左右脑区均有统计学差异,且左侧脑区萎缩的更严重。2.3.4多元线性回归分析结果MMSE在临床上常被用来进行神经心理测试,其方法简单易理解,常用来对AD进行筛选。10 山西医科大学硕士学位论文多元线性回归(multiplelinearregression)用来分析应变量与自变量间的线性关系。模型一般形式:Y=𝛽0+𝛽1𝑋1+𝛽2𝑋2+𝛽𝑚𝑋𝑚+⋯+𝑒其中β0为常数项,βm为偏回归系数。偏回归系数代表在控制其他自变量不变的情况下,每增加(减少)一个单位所引起的Y的平均变化量。接下来我们研究MMSE评分与28项MRI特征指标的线性关系。28项MRI特征指标与MMSE进行多元线性回归分析,自变量选择方法选用逐步回归法,检验水准α入:0.05,α出:0.10,结果见表2-3。表2-3多元线性回归分析结果变量bSbtP常数项15.2081.6829.040<0.01TA-右颞下回0.140.5543.169<0.01SV-左侧脑室下角-0.1280.001-2.889<0.01TA-左内嗅皮层0.1920.2973.438<0.01TA-左梭状回0.1230.6382.5240.01HS-左海马下托0.280.0015.968<0.01表2-3看出,MMSE与TA-右颞下回、SV-左侧脑室下角、TA-左内嗅皮层、TA-左梭状回、HS-左海马下托有线性回归关系。MMSE与SV-左侧脑室下角负相关,其余为正相关,且HS-左海马下托的回归贡献最大。以海马下托体积做解释,海马下托体积越大,MMSE评分越高。随着疾病进展,海马萎缩加重,MMSE量表得分越来越少。11 山西医科大学硕士学位论文3机器学习模型3.1机器学习理论机器学习(MachineLearning,ML)是一门涉及多领域的交叉学科,通过借助计算机强大的数据处理能力,使计算机具有模拟人类学习的行为,并且通过学习获得知识。借助计算机从数据中产生“模型”的算法,称之为“学习算法”。当获得学习算法后,它就可以基于这些经验数据(已有的数据)产生模型,在面对新的数据时,模型将给出相应的判断。本研究旨在通过前面获得的MRI特征指标,进入几种机器学习算法中训练,从而获得关于AD不同疾病进程的算法模型。通过比较不同MRI指标在同一种算法模型以及相同MRI指标在不同算法模型中的准确率、特异度、灵敏度、ROC曲线下面积(AreaUnderROCCurve,AUC)进而综合评价模型,选择出最佳模型,用于对MCI、AD的预测分类,从而协助临床诊断AD。3.2本课题涉及到的几种机器学习算法3.2.1决策树(1)决策树基本理论决策树(decisiontree,DT)是一种比较经典的分类方法。它是基于树结构来进行决策的,也就是利用规则对数据进行分类。主要通过两步完成,这也是所有机器学习算法构造的共同步骤。首先对样本集进行训练生成决策树,其次对所生成的决策树进行剪枝。通过运用测试样本集对之前产生的规则进行校验,剪掉影响预测结果的分枝。(2)决策树原理根据分布特征将数据划分到不同区域,尽可能保证结点所含的样本全部归属于同一类别,也就是“纯度”越高越好。度量纯度常用的标准就是信息熵(informationentropy),公式如下:Entropy=−𝑝∗log(𝑝)−(1−𝑝)∗log(1−𝑝)(3-1)P代表当前节点中正样本的比例,熵越大表示树节点的样本越杂。为了克服样本杂的缺陷,熵越小越好。在对分类问题建模时常需要提出一个假设,即第i个样本的结果𝑝𝑖的靠谱程度可通过下列公式来衡量:12 山西医科大学硕士学位论文𝐿=𝑝𝑦𝑖∗(1−𝑝)1−𝑦𝑖(3-2)𝑖𝑖𝑖𝑦𝑖是第i个样本的类标签,假设对样本的类别进行判断,结果正确的概率服从伯努利分布,即所有样本互相独立且服从分布一样。这样,我们可以写出整个数据集的目标函数:Loss=∏𝑛[𝑝𝑦𝑖.(1−𝑝)1−𝑦𝑖](3-3)𝑖=1𝑖𝑖接下来两边取对数并取反:𝑓=−log(Loss)(3-4)该函数求最小值也就是对原函数求最大值,得出的凸函数仅有一个最小值。问题𝑓便转化为求极值的函数参数,仅求一阶导为0,也就是求𝑝𝑖,令=0,公式展开并求𝑝𝑖解:∑𝑚𝑦𝑖=1𝑖𝑝𝑘=(3-5)𝑚m代表了该节点的所有样本,𝑝𝑘代表正样本的比例。将𝑝𝑘带入公式得到:𝑓=−∑𝑚𝑦log(𝑝)−∑𝑚(1−𝑦)log(1−𝑝)(3-6)𝑘𝑖=1𝑖𝑘𝑖=1𝑖𝑘使用节点样本数行归一化,可用来消除节点样本个数对该值的影响,得到:𝑓𝑘=−𝑝𝑘log(𝑝𝑘)−(1−𝑝𝑘)log(1−𝑝𝑘)(3-7)𝑚以上为决策树算法的数学原理。3.2.2随机森林(1)随机森林学习算法基本理论随机森林(randomforest,RF)是由许多决策树分类模型组合成的一个组合分类器算法,于2001年由LeoBreiman提出。RF属于集成学习的一种,集成学习是通过构建并结合多个学习器来完成学习任务。多个学习器结合起来往往会获得更优越的性能。RF从原样本中抽取多个样本是借助于自助(bootstrap)重抽样法进行的。首先对每个样本进行决策树建模,然后将这些决策树模型集合在一起,通过投票选出最终结果。算法的本质是构建一个树型分类器集合并利用该集合通过投票进行分类和预测。可以看出RF是由许多的决策树组合而成。一棵树的分类能力可能会很小,但是经过大量的决策树后,每棵树的分类结果都可对一个测试样本进行投票进而选择出最佳分13 山西医科大学硕士学位论文类模型。由于RF机器学习算法获得很好的性能,完美地弥补了单分类器性能不高的缺陷,因此该分类器可被用于各种分类和预测中。(2)随机森林算法数学原理随机森林是由许多决策树组成的,这里我们不再对决策树相关数学原理进行具体阐述,区别是RF通过构造不同的训练集来增加分类模型间的差异,从而提高分类模型的预测效果。分类决策为:(3-8)公式解释为,通过k轮训练得到一个分类模型序列,再将分类模型序列构建成一个多分类模型系统,采用简单多数投票法来决定最终分类结果。H(x)代表组合分类模型,hi表示一个决策树分类模型,Y表示目标变量。DT不容易陷入过拟合,训练速度快,实现比较简单。3.2.3支持向量机支持向量机(SupportVectorMachine,SVM)是基于统计学理论的一种学习算法。它能够克服过学习、陷入局部最小等问题,具有很好的泛化能力,并且在解决小样本、非线性问题上展现出自己的优势。支持向量机以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,是一种基于结构风险最小化准则的学习方法。其优点主要在于克服了传统方法中关于过学习、陷入局部最小的问题,并且具有很好的泛化能力。对于线性分类(见n图1-1)样本集T={(xyiii,),=1,2,L,l},xRi∈,yi∈+−{1,1},SVM可通过做出一个决策函数fx()=sgn(())gx来对训练集样本进行正确地分类,并且使得分类超平面具有不错的推广能力,得出的分类超平面()0ω⋅+=xb必须保证分类间隔是最大的。对于线性不可分问题(见图1-2,1-3),SVM通过引进一个非线性映射φ将低维空间里出现的线,性不可分映射到高维空间里,在高维空间进行线性可分,进而用分类学习器获得求解。14 山西医科大学硕士学位论文图1-1线性分类分割间隙越大,就越容易将两个不同类别的点分开,可以看出图1-1(b)分类效果更好。这在SVM中称为分类间隔最大化,是SVM的理论基础之一。图1-1(b)中被颜色圈出来的点即为支持向量(supportvector)。图1-2线性不可分图1-3线性不可分图1-2,1-3是一个典型的不可分问题。很难找到一条将其分开并使得每个区域包含相同类别的直线,但通过使用曲线可以将其完全分开,曲线作为一种非线性情况,可解决线性不可分问题。支持向量作为SVM训练的结果,在SVM分类中起主宰作用。找到最优超平面、划分最优超平面、使得分类间隙最大是SVM的目标。SVM最大的特点就是可以避免“维数灾难”,因为最终的决策函数取决于少量的特征属性,所以计算的复杂度是基于支持向量的数目而不是原始数据的空间属性维度。3.2.4K近邻15 山西医科大学硕士学位论文K近邻(K-NearestNeighbor,KNN)算法是一种常用的监督学习方法,其工作原理比较简单。首先给出测试集样本,通过某种距离度量找出在训练集中与其距离最近的K个样本,随后基于这K个样本中出现次数最多的类别用来作为预测结果。与前面介绍的学习算法的方法进行比较,KNN最明显的区别在于它没有显示的训练过程,仅仅把样本保存起来,因此训练时间零开销,当得到测试样本时才进行处理。实现KNN算法关键在于如何高效率地对训练集样本进行快速K近邻搜索,这在出现特征空间维数很大、训练集样本数量多时是非常重要的。在KNN中选择的所有邻居都是已经被正确归类的对象。方法很简单,就是根据最相邻近的一个或几个对象的类别来决定测试集样本最终的归属类别。KNN算法简单有效,其分类器不需要通过对训练集样本进行训练来得出模型,训练时间的复杂度为0。由于KNN机器学习算法主要依赖周围邻近的样本,因此在遇到类域交叉、重叠较多的待测试集样本问题时,KNN学习算法更优于其他机器学习算法。3.3机器学习算法实现过程本实验涉及的机器学习算法模型的编程实现和数据的预测均在Matlab2016a版本中进行。Matlab作为一款著名的数学软件,由美国MathWorks公司出品。用途有:数据可视化、算法开发、数据分析及计算等。其基本数据单位是矩阵。每个算法都有自己具体的编程语言,但这四种机器学习算法的整体流程是一致的。(1)每次操作前清空环境变量,导入数据。按照Matlab数据格式要求,行代表一个样本,列代表一个特征属性。如543例研究对象代表543个样本,272项MRI指标代表272项特征属性。数据以矩阵形式导入,如543×272矩阵。MRI+MMSE+受教育程度+年龄作为一个文件夹,MRI属性(272项、28项、5项、HS、SA、SV、CV、TA)以及四种分类器(RF、SVM、KNN、DT)的函数调用(建为m格式)等都进入Matlab2016a文件夹区域。工作空间窗口主要用来实现训练和预测,主要工作在此窗口进行,包括在编辑器中编写程序、调试窗口进行调试以及程序运行的实现。结果在命令行窗口展示。(2)数据归一化由于原始数据的数值取值范围广以及使用的单位不同,直接输入数据不仅会降低模型性能,也会出现数值大的特征指标占据较大权重的现象。因此,16 山西医科大学硕士学位论文为确保数据在度量空间的分布均匀性,需要对数据进行归一化处理。这样不仅解决量纲问题,且收敛速度好。通过限制数据范围,寻优过程也能覆盖到参数的最优值。由于本研究中的所有MRI数据均为正值(大于0),因此采用以下函数映射,将MRI数据映射到[0,1],归一化处理如下:𝑋−𝑚𝑖𝑛𝑋∗=𝑚𝑎𝑥−𝑚𝑖𝑛(3)训练集与测试集的选取数据归一化后,将数据集划分为10个相似的互斥子集,并保持每个子集在数据分布上呈现一致性。每次将9个子集并集作为训练集用于构建预测模型,剩下的那个子集作为测试集来对模型性能进行测试。因此,共获得十组训练/测试集,最终获得10个结果的均值。(4)构建模型、分类测试训练集样本用来对数据进行训练,从数据中产生模型。然后将测试集样本进入模型进行测试,用来检验所选模型的性能。本研究涉及到四种机器学习,因此训练出四个学习分类器,根据每次学习得到的分类模型来对测试集样本的类别进行分类预测,将测试集样本在已训练好的模型中进行分类,获得分类结果。并根据十折交叉验证法获得的分类准确率以及特异性、灵敏度、ROC曲线下的面积(AUC)来评价模型的优劣。一般情况下,准确率越高,灵敏度、特异性越高,AUC值越大,模型性能越好。本课题整个流程图见图1-4。17 山西医科大学硕士学位论文图1-4技术路线图18 山西医科大学硕士学位论文4结果MRI特征指标的选取,对算法预测结果影响很大。本课题主要研究不同脑区及不同算法对AD、MCI分类的影响。不同脑区即272项原始指标、28项经多重比较组间有统计学差异的指标、多元回归分析筛选的5项指标以及单独运用皮层下体积(49项)、表面积(70项)、皮层体积(69项)、皮层厚度(68项)、海马亚区体积(16项)指标。本研究中不同算法即决策树(DT)、随机森林(RF)、支持向量机(SVM)、K近邻(KNN)。十折交叉验证获得预测准确率。并结合灵敏度、特异度、AUC来判断模型的优劣,进而选出对CN-EMCI-LMCI-AD两两分类的最佳预测模型。4.1CN-EMCI-LMCI-AD两两分类结果仿真图4.1.1十折交叉验证十折交叉验证常被用来作为测试算法准确性的测试手段。方法是先将数据集D划分为10个大小相似的互斥子集,通过分层采样得到分布一致性的数据,之后每次用9个子集的并集训练,剩下的子集用来进行测试。可以看出,共进行10次训练/测试总共获得10组训练/测试集,最终结果是10个测试结果的均值。本课题研究对象543例,CN组139例,EMCI组220例,LMCI组108例,AD组76例。样本数的不同选取,导致十折交叉验证的训练和测试样本数不同。例如LMCI-AD两组共184例研究对象,通过十折交叉验证测试集样本数为18。预测准确率为预测结果与真实结果的比值。在Matlab编程软件中为了易于操作,将CN、EMCI、LMCI、AD分别赋值为0、1、2、3。这样得到六组分类组合,即0-1,0-2,0-3,1-2,1-3,2-3。经过十折交叉验证获得的预测结果,以CN-AD(0-3)预测分类结果为例,见图2-1。19 山西医科大学硕士学位论文预测结果与真实结果对比3预测结果真实值2.521.5预测结果10.500510152025测试样本图2-1CN-AD预测分类结果图2-1是28项MRI特征指标在SVM的预测分类结果,蓝色代表真实结果,红色代表模型预测结果。蓝色与红色重叠,即为预测正确。横坐标代表测试样本数目,纵坐标代表测试实际结果,0代表CN,3代表AD。0组139例样本,3组76例样本,总计215例样本。十折交叉验证法,测试集为一个子集,即22例样本作为测试集样本。图中看出20个样本预测正确,错误为2个,预测准确率为90.90%。4.1.2ROC曲线下的面积ROC曲线下的面积,即AUC(AreaUnderROCCurve)。ROC全称为“受试者工作特征曲线”,横轴为假正例率,纵轴为真正例率。假正例率为1减去特异度,特异度是把实际为假值的,判断为假值的概率。真正例率为灵敏度,指实际为真的判断为真的概率。AUC可通过对ROC曲线下的面积求和而得。一般认为AUC在0.5-0.7的分类价值较低;在0.7-0.9时,可认为分类价值中等;大于0.9则认为分类价值较高。以LMCI-AD(2-3)分类组别为例,28项MRI指标作为特征指标进进行预测分类,AUC值为0.91。结果见图2-2。20 山西医科大学硕士学位论文ROC曲线1ROC曲线0.90.80.70.60.50.4AUCTruepositiverate0.30.20.1000.10.20.30.40.50.60.70.80.91Falsepositiverate图2-228项MRI特征指标区分EMCI-AD的AUC值图2-2中,横坐标代表假正例率,纵坐标代表真正例率,AUC为ROC曲线下的面积,AUC值为0.91。4.2CN-EMCI的预测结果四种机器学习算法作为分类器基于不同MRI特征指标对CN-EMCI的预测效果不同。RF、SVM、KNN、DT分别代表随机森林、支持向量机、K近邻、决策树。不同MRI特征指标有272项、28项、5项、皮层下体积(SV)49项、皮层体积(CV)69项、表面积(SA)7项、皮层厚度(TA)68项以及海马亚区体积(HS)16项。CN-EMCI的预测结果见图2-3。21 山西医科大学硕士学位论文100CN-EMCI预测结果(%)908070)60RF%50SVM40KNN准确率(30DT20100272项28项5项SVCVSATAHS图2-3不同MRI特征指标在四组机器学习算法中对CN-EMCI的预测结果CN-EMCI的预测结果看出,在四种分类器中RF对不同MRI特征指标的预测效果优于其余三种分类器。除了5项指标在DT的预测准确率最高,为61.11%,其余三种分类器的最高预测准确率均发生在28项指标,预测准确率分别为77.78%、65.28%、59.72%。因此,基于RF的28项MRI指标用于区分CN和EMCI效果最好,准确率为77.78%。4.3CN-LMCI的预测结果不同MRI特征指标、不同机器学习算法对CN和LMCI的预测结果见图2-4。100CN-LMCI预测结果(%)908070)60RF%50SVM40KNN准确率(30DT20100272项28项5项SVCVSATAHS图2-4不同MRI特征指标在四组机器学习算法中对CN-LMCI的预测结果22 山西医科大学硕士学位论文图2-4CN-LMCI的预测结果表示,SVM的5项指标预测准确率最高,为75.60%。KNN的28项指标预测准确率为71.60%,DT的5项指标预测准确率为70.80%,RF的28项指标预测准确率为88.00%。可见基于RF的28项MRI指标用于区分CN和LMCI效果最好。4.4CN-AD的预测结果不同MRI特征指标、不同机器学习算法对CN和AD的预测结果见图2-5。100CN-AD预测结果(%)908070)60RF%50SVM40KNN准确率(30DT20100272项28项5项SVCVSATAHS图2-5不同MRI特征指标在四组机器学习算法中对CN-AD的预测结果从图2-5CN-AD的预测结果看出,28项指标在RF、SVM、KNN、DT的预测准确率最高,分别为96.45%、90.90%、89.55%、88.18%。可见基于RF的28项MRI指标用于区分CN和AD效果最好。4.5EMCI-LMCI的预测结果EMCI-LMCI的预测结果见图2-6。23 山西医科大学硕士学位论文100EMCI-LMCI预测结果(%)908070)60RF%50SVM40KNN准确率(30DT20100272项28项5项SVCVSATAHS图2-6不同MRI特征指标在四组机器学习算法中对EMCI-LMCI的预测结果图2-6结果表示,SVM的SA指标对EMCI-LMCI预测准确率最高,为71.21%。KNN的5项指标预测准确率最高,为67.58%。DT的28项指标预测准确率最高,为64.58%。RF的28项指标预测准确率为81.82%。因此,基于RF的28项MRI指标用于区分EMCI和LMCI效果最好。4.6EMCI-AD的预测结果EMCI-AD的预测结果见图2-7。100EMCI-AD预测结果(%)908070)RF60%50SVM40KNN准确率(30DT20100272项28项5项SVCVSATAHS图2-7不同MRI特征指标在四组机器学习算法中对EMCI-AD的预测结果24 山西医科大学硕士学位论文EMCI-AD预测结果显示,RF、SVM、KNN、DT四种机器学习算法在28项特征指标的预测率达到最高,分别为90.00%、86.67%、84.33%、81.67%。其中RF的28项特征指标预测准确率最高,用于区分EMCI和LMCI效果最好。4.7LMCI-AD的预测结果EMCI-AD的预测结果显示,不同MRI特征指标在不同算法的预测准确率不同。DT的5项指标预测结果最高,达到68.89%。KNN的5项和28项预测结果一样,为65.56%。SVM和RF的28项预测率最高,分别为72.78%和84.21%,可见RF的28项特征指标预测准确率最高。结果见图2-8。100LMCI-AD预测结果(%)908070)60RF%50SVM40KNN准确率(30DT20100272项28项5项SVCVSATAHS图2-8不同MRI特征指标在四组机器学习算法中对LMCI-AD的预测结果4.8SVM与RF的预测结果比较CN-EMCI-LMCI-AD两两分类结果显示,28项MRI特征在RF的预测准确率最高,SVM次之。为了综合比较两类算法,结合特异度、灵敏度、AUC综合评价SVM、RF两种模型。结果见表2-1。表2-1SVM与RF的预测结果比较名称CN-EMCICN-LMCICN-ADEMCI-LMCIEMCI-ADLMCI-AD准确率(%)65.2874.0090.9070.9186.6772.78SVM灵敏度(%)78.3461.6581.8629.0568.2558.88特异度(%)27.5383.9692.870.8393.5680.8125 山西医科大学硕士学位论文AUC0.520.730.950.600.720.57准确率(%)77.7888.0096.4581.8290.0084.21灵敏度(%)79.3764.6488.2138.8393.2268.08RF特异度(%)33.7484.3593.7486.0692.3772.86AUC0.570.840.980.740.880.91表中看出RF的预测准确率均高于SVM,且无论SVM或RF,预测准确率由高到低依次为CN-AD、EMCI-AD、CN-LMCI、LMCI-AD、EMCI-LMCI、CN-EMCI。在CN-AD的分类预测中,RF的AUC为0.98,大于SVM的AUC(0.95)。RF在EMCI-AD、CN-LMCI、LMCI-AD、EMCI-LMCI、CN-EMCI分类预测中的AUC为0.88、0.84、0.91、0.74、0.57,SVM的AUC为0.72、0.73、0.57、0.60、0.52。可见RF的预测准确率及AUC均大于SVM。因此,RF在28项MRI特征指标中对CN-EMCI-LMCI-AD两两分类预测效果优于其余三种机器学习算法模型,对AD、MCI的早期诊断有一定的意义。26 山西医科大学硕士学位论文5讨论5.1MCI、AD的MRI特征指标分析特征选择作为一个重要的“数据预处理”(datapreprocessing)过程,可以解决现实任务中的维数灾难问题,而维数灾难是由于属性过多造成。本研究中获得272项MRI特征属性,若仅按照AD发病部位有针对性去筛选属性,如海马、海马旁回、内侧颞叶等,将无法真正从中发现一些AD潜在病变。只将272项属性全都进行分析,将会发生维数灾难。若能从中选择出重要的特征,并且确保不丢失重要特征,去除“冗余特征”,将会降低机器学习任务的难度。272项原始MRI特征指标,包括69项皮层体积(CV)、49项皮层下体积(SV)、68项皮层厚度(TA)、70项表面积(SA)和16项海马亚区体积(HS)。经统计学方法进行数据降维后共获得28项特征指标、5项特征指标。28项指标在CN-EMCI-LMCI-AD两两分类中的预测准确率最高。28项指标为海马(SV-左右海马)、海马亚区(HS-右CA1、HS-左右CA2-3、HS-左右CA4-DG、HS-左右海马前下托,HS-左右海马下托)、杏仁核(SV-左右杏仁核)、内嗅皮层(TA-左右内嗅皮层)、颞叶(CV-右颞下回、TA-左颞上回、TA-右颞中回、TA-左右颞下回、TA-左右颞极)、及侧脑室下角(SV-左右侧脑室下角)。海马、海马亚区、内嗅皮层以及杏仁核隶属于边缘系统的组成结构。由此看出,28项特征指标主要分布在边缘系统和颞叶。[21,22]边缘系统可调节感觉信息、影响情绪,同时也对学习、记忆、睡眠、性行为[23,24]有重要作用。AD及早期患者可发生记忆功能减退、出现抑郁、睡眠及觉醒障碍[25-30]以及性功能异常等。其中海马主要负责学习和记忆,其萎缩情况反映AD病情的[31]严重程度。随着MCI向AD进展,海马体积减少得更严重。有研究发现,CA2-3、CA4-DG、下托等这些海马亚区在测试-重复的再现性上同海马的表现是非常相似的,[32]表明海马亚区也可被用来反映或预测疾病进展的情况,并且海马亚区可能更适合[33]预测AD。杏仁核附着于海马末端,是情绪、学习和记忆的重要脑部结构。内嗅皮层作为媒介大脑,联络着新皮层与海马结构。内嗅皮层第2、3层神经元发出的穿通束作为海马结构兴奋性传入的主要来源,第4层神经元接受绝大部分海马传出投射。当发生AD时,内嗅皮层的第2、4层神经元将会累及,致使海马结构的传入/传出通27 山西医科大学硕士学位论文[34][35][32][15]路被切断,从而引起患者的记忆障碍。海马、海马亚区、内嗅皮层、颞叶[36]均被单独用来作为研究AD疾病进展的指标。颞叶有位于优势半球颞上回后部的感觉语言中枢、位于颞上回中部及颞横回的听觉中枢、位于沟回海马回前部的嗅觉中枢以及与记忆联想有关的高级中枢,而海马则位于颞叶内侧面。颞叶出现损伤时引起记忆功能下降,因此颞叶萎缩可以用来预测[37]AD的进展情况。侧脑室下角具有特殊的解剖构造,向前下方伸入颞叶中。发生[38]AD时,脑实质萎缩,脑室扩大,脑室体积变大可作为一项预测AD的特征指标。选出的28项MRI指标中,除SV-侧脑室下角随疾病进展逐渐变大,其余指标均逐渐变小。说明随着疾病从MCI向AD进展,指标下降,脑区萎缩程度愈发严重。28项MRI中有22项(11对)指标为配对指标,经配对样本比较分析后发现,随着疾病进展,除HS-海马前下托、CV-颞下回、HS-海马下托左右脑区萎缩程度无明显差异外,其余指标均表现出左侧脑萎缩程度更甚于右侧脑。有研究将AD大脑半球发[39]病程度的不对称性这一现象应用于药物研究中。因此在今后的疾病治疗及药物研究中,药物选择何种给药方式及药物浓度的选择应该在对待大脑左右半球有所区别,从而使得治疗效果发挥到最佳状态。5.2CN-EMCI-LMCI-AD两两分类结果比较[11,40,41]MCI分为EMCI和LMCI。不同于以往研究对CN-MCI-AD进行两两分类。若在AD更早期阶段对疾病做出正确的判断,将很大程度上减轻疾病带给社会、家庭及个人的负担。本研究对CN-EMCI-LMCI-AD进行两两分类,使得分类更加具体化、细化,有助于在疾病更早期做出诊断。本研究涉及到的四种分类模型RF、SVM、KNN、DT,一致性地在CN-AD的分类预测准确率最高,为96.45%。其次为EMCI-AD(90%)、CN-LMCI(88%)、LMCI-AD(82.41%)、EMCI-LMCI(81.82%),CN-EMCI(77.78%)预测准确率较低。但总体[11]来说,六个组别分类准确率都比较高,尤其对EMCI-AD的分类结果最高。有研究在引入性别、年龄后对CN-AD的预测准确率达到91.07%。基于PCA-FLDA集成分类器对CN-EMCI-LMCI-AD进行两两分类,CN-AD的分类结果达95.65%,CN-EMCI[42]分类结果为60.53%。CN-AD的预测准确率最高,可能由于认知正常组和AD组的脑部差异很大,易于区分。而EMCI、LMCI位于疾病进展的中间阶段,EMCI属于28 山西医科大学硕士学位论文轻度认知障碍的早期阶段,LMCI属于轻度认知障碍的晚期阶段。因此CN-EMCI、CN-LMCI的预测准确率均低于CN-AD。CN-EMCI的准确率最低,两者不易区分开来,目前现有的研究对CN-EMCI分类的准确率很低,最高为60.53%,本研究的准确率为77.78%。因此提高CN-EMCI的预测准确率将有助于在疾病最早期做出诊断,从而进行相应的防治措施,进而预防疾病的发生及进展。若增加样本量,可用于对CN-EMCI-LMCI-AD的四分类研究。5.3RF分类器机器学习研究的内容是利用计算机训练数据从而产生“模型”。机器学习已逐步[43-47]成熟并应用于AD的分类预测中,RF就是算法模型中的一种,作为新的机器学习技术之一,被誉为“代表集成学习技术水平的方法”。RF优势在于,在数据集上有良好的表现,引入两个随机性使得RF不易出现过拟合,并且在抗噪声能力方面表现出优势。对数据处理能力强,既能处理离散型数据,也能处理连续型数据,并且在[12,48]处理高维数据上有独特优势,有简单易实现、计算开销小等优点。RF通过bootstrap重抽样法从原始样本中进行样本抽取,并对每个样本建模,之后对所有决策树投票,综合选出最终结果。由于RF是在DT基础上构建的分类器,本研究也将DT作为一个分类预测模型进行预测,并与RF进行对比。当下预测AD比较流行的预测[41,49][41]模型也有SVM、KNN。SVM对AD的分类预测准确率最高为91.6%,最低仅[49]为59.1%,有研究基于SVM对CN-AD、CN-MCI、MCI-AD进行分类预测,准确[50]率分别为89%、79%、85%。因此研究涉及到四种分类预测模型,通过对比选择出最优模型。272项、28项、5项、SV、SA、CV、TA、HS所有MRI特征指标在RF分类器的分类预测效果最好,其次为SVM,DT综合预测效果最差。并且28项MRI特征指标的分类效果最好。比较28项指标在SVM、RF的预测结果发现,后者的分类准确率和AUC均高于前者,并且在EMCI-AD、CN-LMCI、LMCI-AD、EMCI-LMCI,CN-EMCI分类中均呈现此规律。评选出来的最优预测模型为,基于28项MRI指标的RF分类预测模型。因此RF可用来进行MCI/AD的分类预测。若增加样本量,还可预测MCI向AD转化的危险性。29 山西医科大学硕士学位论文6结论1.对比不同机器学习分类器,RF分类器对AD的不同疾病进程预测效果最好。2.对比不同MRI特征指标,28项MRI指标作为分类特征预测效果最好。3.CN-AD分类效果最好,其次为EMCI-AD,CN-LMCI,LMCI-AD,EMCI-LMCI,CN-EMCI分类准确率较低。整体而言,RF对CN-EMCI-LMCI-AD的分类准确率都高于其他模型。RF分类器有效地提高了MCI/AD的自动诊断效率,可对AD早期不同阶段进行分类,用来辅助诊断AD。30 山西医科大学硕士学位论文参考文献[1]2016Alzheimer'sdiseasefactsandfigures[J].AlzheimersDement,2016,12(4):459-509.[2]张静爽,王蓉.阿尔茨海默病发生机制的研究进展[J].首都医科大学学报,2014,(06):721-724.[3]FaivreE,HolscherC.NeuroprotectiveeffectsofD-Ala(2)GIPonAlzheimer'sdiseasebiomarkersinanAPP/PS1mousemodel[J].AlzheimersResTher,2013,5(2):20.[4]VanacoreN,DiPucchioA,LacorteE,BacigalupoI,MayerF,GrandeG,CesariM,CanevelliM.[Frommildcognitiveimpairmenttodementia:whatistheroleofpublichealth?][J].RecentiProgMed,2017,108(5):211-215.[5]EwersM,BuergerK,TeipelSJ,ScheltensP,SchroderJ,ZinkowskiRP,BouwmanFH,SchonknechtP,SchoonenboomNS,AndreasenN,WallinA,DeBernardisJF,KerkmanDJ,HeindlB,BlennowK,HampelH.MulticenterassessmentofCSF-phosphorylatedtauforthepredictionofconversionofMCI[J].Neurology,2007,69(24):2205-2212.[6]PetersenRC,DoodyR,KurzA,MohsRC,MorrisJC,RabinsPV,RitchieK,RossorM,ThalL,WinbladB.Currentconceptsinmildcognitiveimpairment[J].ArchNeurol,2001,58(12):1985-1992.[7]BudsonAE,SolomonPR.NewdiagnosticcriteriaforAlzheimer'sdiseaseandmildcognitiveimpairmentforthepracticalneurologist[J].PractNeurol,2012,12(2):88-96.[8]FayedN,ModregoPJ,Garcia-MartiG,Sanz-RequenaR,Marti-BonmatiL.Magneticresonancespectroscopyandbrainvolumetryinmildcognitiveimpairment.Aprospectivestudy[J].MagnResonImaging,2016,38:27-32.[9]FrisoniGB,FoxNC,JackCRJr,ScheltensP,ThompsonPM.TheclinicaluseofstructuralMRIinAlzheimerdisease.[J].NatRevNeurol,2010,6(2):67-77.[10]FanY,BatmanghelichN,ClarkCM,DavatzikosC.SpatialpatternsofbrainatrophyinMCIpatients,identifiedviahigh-dimensionalpatternclassification,predictsubsequentcognitivedecline[J].Neuroimage,2008,39(4):1731-1743.[11]李慧卓,相洁,秦嘉玮,梁佩鹏,李坤成.基于Adaboost的轻度认知障碍和阿尔茨海默病分类[J].中国医学影像技术,2016,(04):623-627.[12]方匡南,吴见彬,朱建平,谢邦昌.随机森林方法研究综述[J].统计与信息论坛,2011,(03):32-38.[13]DhikavV,AnandK.PotentialpredictorsofhippocampalatrophyinAlzheimer'sdisease[J].DrugsAging,2011,28(1):1-11.31 山西医科大学硕士学位论文[14]CarlesimoGA,PirasF,OrfeiMD,IorioM,CaltagironeC,SpallettaG.AtrophyofpresubiculumandsubiculumistheearliesthippocampalanatomicalmarkerofAlzheimer'sdisease[J].AlzheimersDement(Amst),2015,1(1):24-32.[15]elayudhanL,ProitsiP,WestmanE,MuehlboeckJS,MecocciP,VellasB,TsolakiM,KloszewskaI,SoininenH,SpengerC,HodgesA,PowellJ,LovestoneS,SimmonsA.EntorhinalcortexthicknesspredictscognitivedeclineinAlzheimer'sdisease[J].JAlzheimersDis,2013,33(3):755-766.[16]VisserPJ,VerheyFR,HofmanPA,ScheltensP,JollesJ.MedialtemporallobeatrophypredictsAlzheimer'sdiseaseinpatientswithminorcognitiveimpairment[J].JNeurolNeurosurgPsychiatry,2002,72(4):491-497.[17]MisraC,FanY,DavatzikosC.BaselineandlongitudinalpatternsofbrainatrophyinMCIpatients,andtheiruseinpredictionofshort-termconversiontoAD:resultsfromADNI[J].Neuroimage,2009,44(4):1415-1422.[18]MuellerSG,WeinerMW,ThalLJ,PetersenRC,JackCR,JagustW,TrojanowskiJQ,TogaAW,BeckettL.WaystowardanearlydiagnosisinAlzheimer'sdisease:theAlzheimer'sDiseaseNeuroimagingInitiative(ADNI)[J].AlzheimersDement,2005,1(1):55-66.[19]JackCR,Jr.,KnopmanDS,JagustWJ,ShawLM,AisenPS,WeinerMW,PetersenRC,TrojanowskiJQ.HypotheticalmodelofdynamicbiomarkersoftheAlzheimer'spathologicalcascade[J].LancetNeurol,2010,9(1):119-128.[20]BartelF,VrenkenH,BijmaF,BarkhofF,vanHerkM,deMunckJC.Regionalanalysisofvolumesandreproducibilitiesofautomaticandmanualhippocampalsegmentations[J].PLoSOne,2017,12(2):e0166785.[21]CallahanBL,LaforceR,DugasM,HudonC.Memoryforemotionalimagesdiffersaccordingtothepresenceofdepressivesymptomsinindividualsatriskfordementia[J].IntPsychogeriatr,2016:1-13.[22]LiX,WangH,TianY,ZhouS,WangK,YuY.ImpairedWhiteMatterConnectionsoftheLimbicSystemNetworksAssociatedwithImpairedEmotionalMemoryinAlzheimer'sDisease[J].FrontAgingNeurosci,2016,8:250.[23]CataniM,Dell'acquaF,ThiebautdeSchottenM.Arevisedlimbicsystemmodelformemory,emotionandbehaviour[J].NeurosciBiobehavRev,2013,37(8):1724-1737.[24]GuoW,LiuF,XunG,HuM,GuoX,XiaoC,ChenH,ChenJ,ZhaoJ.Disruptedwhitematterintegrityinfirst-episode,drug-naive,late-onsetdepression[J].JAffectDisord,2014,163:70-75.[25]LedoJH,AzevedoEP,BeckmanD,RibeiroFC,SantosLE,RazolliDS,KincheskiGC,MeloHM,BellioM,TeixeiraAL,VellosoLA,FoguelD,DeFeliceFG,FerreiraST.CrossTalk32 山西医科大学硕士学位论文BetweenBrainInnateImmunityandSerotoninSignalingUnderliesDepressive-LikeBehaviorInducedbyAlzheimer'sAmyloid-betaOligomersinMice[J].JNeurosci,2016,36(48):12106-12116.[26]MusiekES,HoltzmanDM.Mechanismslinkingcircadianclocks,sleep,andneurodegeneration[J].Science,2016,354(6315):1004-1008.[27]BubuOM,BrannickM,MortimerJ,Umasabor-BubuO,SebastiaoYV,WenY,SchwartzS,BorensteinAR,WuY,MorganD,AndersonWM.Sleep,CognitiveimpairmentandAlzheimer'sdisease:Asystematicreviewandmeta-analysis[J].Sleep,2016.[28]PistollatoF,SumallaCanoS,ElioI,MasiasVergaraM,GiampieriF,BattinoM.AssociationsbetweenSleep,CortisolRegulation,andDiet:PossibleImplicationsfortheRiskofAlzheimerDisease[J].AdvNutr,2016,7(4):679-689.[29]BrangerP,Arenaza-UrquijoEM,TomadessoC,MezengeF,AndreC,deFloresR,MutluJ,deLaSayetteV,EustacheF,ChetelatG,RauchsG.Relationshipsbetweensleepqualityandbrainvolume,metabolism,andamyloiddepositioninlateadulthood[J].NeurobiolAging,2016,41:107-114.[30]NogueiraMM,NetoJP,SousaMF,SantosRL,LacerdaIB,BaptistaMA,DouradoMC.PerceptionofchangeinsexualactivityinAlzheimer'sdisease:viewsofpeoplewithdementiaandtheirspouse-caregivers[J].IntPsychogeriatr,2016:1-9.[31]DhikavV,DuraisamyS,AnandKS,GargaUC.HippocampalvolumesamongolderIndianadults:ComparisonwithAlzheimer'sdiseaseandmildcognitiveimpairment[J].AnnIndianAcadNeurol,2016,19(2):195-200.[32]MarizzoniM,AntelmiL,BoschB,Bartres-FazD,MullerBW,WiltfangJ,FiedlerU,RoccatagliataL,PiccoA,NobiliF,BlinO,BomboisS,LopesR,SeinJ,RanjevaJP,DidicM,Gros-DagnacH,PayouxP,ZoccatelliG,AlessandriniF,BeltramelloA,BargalloN,FerrettiA,CauloM,AielloM,CavaliereC,SoricelliA,SalvadoriN,ParnettiL,TarducciR,FloridiP,TsolakiM,ConstantinidisM,DrevelegasA,RossiniPM,MarraC,HoffmannKT,HenschT,SchonknechtP,KuijerJP,VisserPJ,BarkhofF,BordetR,FrisoniGB,JovicichJ.Longitudinalreproducibilityofautomaticallysegmentedhippocampalsubfields:AmultisiteEuropean3Tstudyonhealthyelderly[J].HumBrainMapp,2015,36(9):3516-3527.[33]VastaR,AugimeriA,CerasaA,NigroS,GramignaV,NonnisM,RoccaF,ZitoG,QuattroneA,ForTheAlzheimer'sDiseaseNeuroimagingI.HippocampalSubfieldAtrophiesinConvertedandNot-ConvertedMildCognitiveImpairmentsPatientsbyaMarkovRandomFieldsAlgorithm[J].CurrAlzheimerRes,2016,13(5):566-574.[34]HymanBT,VanHoesenGW,KromerLJ,DamasioAR.PerforantpathwaychangesandthememoryimpairmentofAlzheimer'sdisease[J].AnnNeurol,1986,20(4):472-481.33 山西医科大学硕士学位论文[35]AchterbergHC,vanderLijnF,denHeijerT,VernooijMW,IkramMA,NiessenWJ,deBruijneM.Hippocampalshapeispredictiveforthedevelopmentofdementiainanormal,elderlypopulation[J].HumBrainMapp,2014,35(5):2359-2371.[36]ConvitA,deAsisJ,deLeonMJ,TarshishCY,DeSantiS,RusinekH.Atrophyofthemedialoccipitotemporal,inferior,andmiddletemporalgyriinnon-dementedelderlypredictdeclinetoAlzheimer'sdisease[J].NeurobiolAging,2000,21(1):19-26.[37]GertjeEC,PlutaJ,DasS,MancusoL,KliotD,YushkevichP,WolkD.ClinicalApplicationofAutomaticSegmentationofMedialTemporalLobeSubregionsinProdromalandDementia-LevelAlzheimer'sDisease[J].JAlzheimersDis,2016,54(3):1027-1037.[38]NestorSM,RupsinghR,BorrieM,SmithM,AccomazziV,WellsJL,FogartyJ,BarthaR.VentricularenlargementasapossiblemeasureofAlzheimer'sdiseaseprogressionvalidatedusingtheAlzheimer'sdiseaseneuroimaginginitiativedatabase[J].Brain,2008,131(Pt9):2443-2454.[39]ManousopoulouA,SaitoS,YamamotoY,Al-DaghriNM,IharaM,CarareRO,GarbisSD.HemisphereAsymmetryofResponsetoPharmacologicTreatmentinanAlzheimer'sDiseaseMouseModel[J].JAlzheimersDis,2016,51(2):333-338.[40]吕鸿蒙,赵地,迟学斌.基于增强AlexNet的深度学习的阿尔茨海默病的早期诊断[J].计算机科学,2017,(S1):50-60.[41]GuoH,ZhangF,ChenJ,XuY,XiangJ.MachineLearningClassificationCombiningMultipleFeaturesofAHyper-NetworkoffMRIDatainAlzheimer'sDisease[J].FrontNeurosci,2017,11:615.[42]李慧卓;相洁.基于集成学习的多模态AD辅助诊断模型研究[硕士学位论文].太原:太原理工大学,2013.[43]CascianelliS,ScialpiM,AmiciS,ForiniN,MinestriniM,FravoliniML,SinzingerH,SchillaciO,PalumboB.RoleofArtificialIntelligenceTechniques(AutomaticClassifiers)inMolecularImagingModalitiesinNeurodegenerativeDiseases[J].CurrAlzheimerRes,2016.[44]LimaAN,PhilotEA,TrossiniGH,ScottLP,MaltarolloVG,HonorioKM.Useofmachinelearningapproachesfornoveldrugdiscovery[J].ExpertOpinDrugDiscov,2016,11(3):225-239.[45]GawehnE,HissJA,SchneiderG.DeepLearninginDrugDiscovery[J].MolInform,2016,35(1):3-14.[46]GhorbanianP,DevilbissDM,HessT,BernsteinA,SimonAJ,AshrafiuonH.ExplorationofEEGfeaturesofAlzheimer'sdiseaseusingcontinuouswavelettransform[J].MedBiolEngComput,2015,53(9):843-855.34 山西医科大学硕士学位论文[47]JandrlicDR.SVMandSVR-basedMHC-bindingpredictionusingamathematicalpresentationofpeptidesequences[J].ComputBiolChem,2016,65:117-127.[48]董师师,黄哲学.随机森林理论浅析[J].集成技术,2013,(01):1-7.[49]SorensenL,NielsenM.EnsemblesupportvectormachineclassificationofdementiausingstructuralMRIandmini-mentalstateexamination[J].JNeurosciMethods,2018.[50]KhedherL,IllanIA,GorrizJM,RamirezJ,BrahimA,Meyer-BaeseA.IndependentComponentAnalysis-SupportVectorMachine-BasedComputer-AidedDiagnosisSystemforAlzheimer'swithVisualSupport[J].IntJNeuralSyst,2017,27(3):1650050.35 山西医科大学硕士学位论文综述基于机器学习的阿尔茨海默病预测研究进展阿尔茨海默病(Alzheimer’sdisease,AD)是一种累及中枢系统的退行性疾病,[1][2]其基因复杂。AD临床特征是进行性的认知功能下降,从而导致患者在临床诊断后几年内完全需要护理。AD是造成60岁以上老年人痴呆症的主要原因。据统计,2015年全球痴呆患者共计4680万人,估计每20年就要翻一番,到2050年将面临1[3]亿3150万的痴呆患者,其中AD患者占2/3。AD给社会、家庭带来了经济和心理上的巨大压力。目前AD病因尚不明确,AD的危险因素有衰老、APOEε4基因亚型、[4,5][6]性别、高胆固醇血症、头部外伤、受教育程度、抑郁症,发病机制复杂多样,且无有效的治疗措施,给医学界带来了巨大的挑战。AD的诊断主要基于多个变量和因素,遗传信息,神经心理学测试,脑脊液生物标志物和脑成像数据。轻度认知功能障碍(mildcognitiveimpairment,MCI)位于正常老年人和痴呆的中间过渡状态,作为AD的主要危险因素,可向AD发展。新指南认为MCI是AD进展的第二个阶段,这不同于以往所说的MCI与AD是异质性,若出现认知损害的[7]症状及病理改变,则诊断为AD。据统计,MCI发病率占全球人口9.9%,年龄大于[8]70岁的人群,MCI发病率为14%至18%。因此,早期识别MCI将有助于预防AD的发生。机器学习作为人工智能的一个重要领域,其目的在于能够使计算机具有自我学习的能力,从而使计算机处理数据的性能得到不断改进和提高。机器学习通过对已有的数据、信息进行学习,从中获取数据和潜在的规律,并将这些规律应用到未知数据的[9]分析和预测中。近年来,机器学习在AD研究领域中被广泛普及。已经证明机器学习和模式识别[10-13]算法能够有效地对AD患者和健康对照组(HC)进行分类。医学影像技术的进步为提取有价值的神经影像信息提供了手段。自动分类技术分析这些影像信息并观察数据中固有的与疾病有关的模式。这些分类器已被用来区分[14]AD患者与健康对照受试者,也包括预测从MCI向AD的转换。能够找到准确诊断AD及早期阶段的标志物,并不断提高准确率,是机器学习在AD应用中不断追求的目标。36 山西医科大学硕士学位论文本文将不同机器学习算法对AD/MCI的预测进展进行综述。1.随机森林在引入随机森林(RandomForest,RF)之前首先介绍下决策树(DecisionTree)。决策树通过树结构做出决策,也就是利用规则对数据进行分类。其做出决策通过两步,首先对样本进行训练,生成决策树。然后对树剪枝,修理,测试。使用测试集样本对生成的规则校准,将干扰预测结果的分枝剪掉。RF是分类和回归树的集合,是通过构建多个学习器进行学习的,所产生的性能更加优越于单一的学习器。RF在许多应用中都展现出强大的性能,并且具有较高的预测准确率。RF不容易出现过拟合,对噪声、异常值都有不错的容忍度,在处理高[15]维数据表现出很好的优势,并且在处理离散型和连续型数据对数据集不需要规范化。RF操作应用起来简单、比较容易实现、计算开销小。[16]有研究通过系统评价分析得出,当RF应用于多模态数据来预测MCI向AD的转化时,它产生了迄今为止非常高的准确度。此外,RF在应用于多模态神经影像数据,如MRI形态测量数据、弥散张量成像和PET图像时进行高效并行处理的机会方面均具有重要优势,表现为过度拟合的稳健性、处理高度非线性数据的高效性、异常值存在下的稳定性。另外一项研究中,结合海马体积、认知测试、人口统计信息来训练随机森林分类器获得MCI、AD的分类,分类整体准确率为82.3%(灵敏度86.0%,[17]特异度78.2%)。并且发现对于女性的预测结果(89.1%)明显高于男性(78.9%)。这与以往的任何机器学习应用于AD诊断中的结果一致,认为女性的预测准确率都是最高的。与男性相比,MCI的女性可能有更强的AD痴呆症指标。基于随机森林分类器及阿尔茨海默病神经影像数据库(Alzheimer’sDiseaseNeuroimagingInitiative,ADNI)的MRI数据对正常组、早期MCI、晚期MCI、AD进行四分类预测,准确率[18]为61.9%,这是不错的四分类预测结果。也有人将6个月的纵向数据用于预测从MCI到AD进展的研究中。使用247名参与者的6个月纵向数据,训练了两个随机森林分类器,结果显示纵向模型(AUC=0.87;准确度=80.2%)比横截面模型(AUC=0.82;准确度=71.7%)效果更好(P<0.05),短期纵向评估显著提高了AD预测模型[19]的性能。2.支持向量机37 山西医科大学硕士学位论文支持向量机(SupportVectorMachine,SVM)是基于统计学理论的机器学习算法。它能够克服过学习、陷入局部最小等问题,具有很好的泛化能力,并且在解决小样本、非线性问题上展现出自己的优势。研究中常用的模型有线性核函数SVM,RBF-SVM以及多项式核函数SVM。SVM[20-26]广泛应用到AD的预测中。有研究基于SVM通过测量左右侧海马形态对AD进行分类,通过对比RBF-SVM与线性核函数SVM的预测准确率,发现RBF-SVM有[27]较好的预测结果,对正常组与AD组分类预测准确率为90%。有团队提出了一种新型的机器学习分类方法,该方法结合了功能磁共振成像的多种超网络特征。首先结合大脑区域特征和子图特征,然后使用多核SVM进行分类,该方法达到了令人满意的分类准确率,平均为91.60%。研究发现的异常脑区包括两侧楔前叶,右侧海马旁[28]回、右侧海马,右侧后扣带回。也有采用多项核函数SVM对AD、MCI进行两两[29]分类,分类准确率为93.2%。可以看出,基于SVM的AD预测研究主要集中在二分类研究上,尤其对AD与正常组的预测较多,准确率也在百分之九十以上。但对EMCI与LMCI的研究相对较少。SVM对AD的研究主要在解决二分类问题上表现出优势,解决多分类问题时仍面临困难,并且在训练样本庞大时难以实施。3.深度学习深度学习(DeepLearning)是一种基于人脑结构和信息处理之上的多层结构算法,是一个包含多层次的复杂学习结构。通过使用反向传播算法来发现大型数据集中的复[30]杂结构,以指示机器应如何更改其内部参数,从而更有利于分类的可视化。当样本[31]数量很大时,深度学习方法非常有效。深度学习常用的模型有:自动编码器(AutoEn-coder)、降噪自动编码器(DenoisingAutoEncoder)、稀疏自动编码器(SparseAuto[32]Encoder)以及限制玻尔兹曼机(RestrictedBoltzmannMachine,RBM)。深度学习[33-40]也普遍应用于AD的研究中。[41]有研究提出了一个强大的深度学习系统,基于MRI和PET扫描来识别AD患者的不同进展阶段。利用dropout技术来完善古典深度学习,将稳定性选择、适应性学习因素和多任务学习策略纳入到深度学习框架。并应用于ADNI数据集,对AD和MCI转化进行了分析。结果表明,dropout技术与传统深度学习方法相比,平均分类准确率提高了5.9%。基于增强AlexNet的深度学习对AD、MCI进行分类预测,获得38 山西医科大学硕士学位论文[42]了不错的分类效果。基于卷积神经网络深度学习的CT脑影像分类方法用于AD的[43]初步筛查显示AD分类准确率为84.2%。使用深度神经网络分类的分类策略,对正[44]常组、MCI早晚期组、AD组进行分类,其分类精度显著高于其他机器学习策略。有研究将卷积神经网络技术应用于CT脑图像分类,对AD、正常组、其他疾病组进行分类,为AD的早期诊断提供帮助。所得到的分类准确率分别为85.2%、95.3%和[39]80%,平均为87.6%。将深度学习方法应用于由自动解剖标签定义的大脑区域,并用ADNI大数据集进行评估。交叉验证结果证明,所提出的方法不仅有效区分对照组和AD图像,而且在针对MCI受试者分类时表现良好。分类准确率值高达0.90,NC/AD[40]分类的AUC为0.95,MCI/AD分类的AUC为0.91,NC/MCI分类的AUC为0.95。深度学习属于神经网络,神经网络最突出的缺陷是无法对自己的推理过程做出恰当的解释,并且网络需要有庞大的数据来进行训练,对硬件配置要求也很高。在当研究样本量较小时模型会出现过拟合,进而得出较差的性能,因此样本量少时不建议选择此模型。4.K近邻学习K近邻(k-NearestNeighbor,KNN)是一种常用的监督学习,最早由Cover和[45]Hart提出。即给定测试集样本,通过采用某种距离度量来找出训练集中与它距离最近的K个样本。KNN作为“懒惰学习”的著名代表,没有显式的训练过程,此学习技术在训练过程中仅把样本保存下来,几乎没有训练时间。KNN用于AD的研究[46,47]较少,主要是基于脑电图信号(electroencephalogram,EEG)对AD进行研究。[46]有文献利用脑电图来诊断AD,用电极记录参与者的脑电图信号,并使用基于相关性的算法来选择最佳判别特征。用神经模糊系统和KNN联合起来对所选特征进行分类,最终准确率88.89%、灵敏度100%和特异度83.33%。这表明所提出的方法可用作MCI的诊断。总之,基于KNN对AD早期预测的研究很少。今后KNN的研究应结合多种生物标志物,如脑脊液、MRI、神经心理学测试来对AD进行研究。5.其他机器学习[48]有研究提出了一种基于可变形方法来区分AD、MCI与健康老年人,并通过计算和分析脑区域形态差异来预测MCI患者向AD的转化。所提出的方法在以全脑灰质或颞叶为感兴趣区来区分轻度AD和健康老年人获得了96.5%的准确性。在以杏仁39 山西医科大学硕士学位论文核或海马作为感兴趣区时获得了91.74%的准确率,用于区分渐进性MCI与健康老年人,88.99%的准确率用于分类渐进性MCI与稳定的MCI。基于纵向和多模态生物标志物的自回归模型用来预测MCI向AD的转化,使用MRI和认知评分进行预测,得[14][13]出ROC曲线下的面积AUC为88.93%,准确率为84.29%。文献集中在基于多特征内核监督类内相似判别式字典学习算法(MKSCDDL)的基础上区分AD/MCI,AD和正常对照组分类准确率为98.18%,MCI与正常组的分类准确率为78.50%,AD与MCI的分类准确率为74.47%,表明MKSCDDL算法可作为利用神经影像学数据辅助疾病早期诊断的一项有前景的工具。一些研究基于马尔科夫(Markov)模型对AD[49,50]疾病进程进行预测最高预测准确率为80.3%。孙倩倩等人采用Markov预测AD[51]在中国的患病趋势。基于Adaboost集成方法对MCI、AD进行两两分类,在增加[52]年龄、性别、MMSE量表评分后,预测准确率有所提高。可见,通过机器学习对AD早期进行预测的研究已成为一种趋势,用计算机代替手动操作,将大大减轻临床医生的工作负担,并且预测准确率也高。目前算法在AD/MCI两两分类上取得了不错的预测效果,尤其在AD与正常对照组的预测准确率最高。但当对正常组、MCI早、晚期及AD进行四分类时,预测效果却并不理想。且不同的机器学习模型对AD疾病的预测结果不同,相同的机器学习分类器在结合不同标志物,比如MRI,脑脊液等不同标记物进行预测时,预测效果也是有差异的。机器学习目的是找到能真正对AD及早期阶段做出正确判断的标志物,并且预测准确率很高,这是机器学习不断追求的目标。每个机器学习都有自己的优缺点,对不同的数据类型选择合适的模型将取得好的预测效果。好的机器学习预测模型应该是预测准确率、灵敏度和特异度高,且耗时少,成本低,应用性强,模型稳定性高。如果能在AD更早期阶段做出正确的预测,将大大减轻疾病给社会、家庭及个人带来的负担。40 山西医科大学硕士学位论文参考文献[1]HampelH,PrvulovicD,TeipelS,JessenF,LuckhausC,FrolichL,RiepeMW,DodelR,LeyheT,BertramL,HoffmannW,FaltracoF.ThefutureofAlzheimer'sdisease:thenext10years[J].ProgNeurobiol,2011,95(4):718-728.[2]AlbertMS,DeKoskyST,DicksonD,DuboisB,FeldmanHH,FoxNC,GamstA,HoltzmanDM,JagustWJ,PetersenRC,SnyderPJ,CarrilloMC,ThiesB,PhelpsCH.ThediagnosisofmildcognitiveimpairmentduetoAlzheimer'sdisease:recommendationsfromtheNationalInstituteonAging-Alzheimer'sAssociationworkgroupsondiagnosticguidelinesforAlzheimer'sdisease[J].AlzheimersDement,2011,7(3):270-279.[3]2016Alzheimer'sdiseasefactsandfigures[J].AlzheimersDement,2016,12(4):459-509.[4]ReitzC,TangMX,SchupfN,ManlyJJ,MayeuxR,LuchsingerJA.AsummaryriskscoreforthepredictionofAlzheimerdiseaseinelderlypersons[J].ArchNeurol,2010,67(7):835-841.[5]BarnesDE,YaffeK.TheprojectedeffectofriskfactorreductiononAlzheimer'sdiseaseprevalence[J].LancetNeurol,2011,10(9):819-828.[6]ReitzC,MayeuxR.Alzheimerdisease:epidemiology,diagnosticcriteria,riskfactorsandbiomarkers[J].BiochemPharmacol,2014,88(4):640-651.[7]刘晋,赵敬堃,段淑荣,赵继巍.轻度认知障碍的研究进展[J].现代生物医学进展,2017,(11):2170-2173+2193.[8]DaveyDA.Alzheimer'sdisease,dementia,mildcognitiveimpairmentandthemenopause:a'windowofopportunity'?[J].WomensHealth(Lond),2013,9(3):279-290.[9]周井泉;龚卫国.高维数据的分类器集成方法研究[硕士学位论文].重庆:重庆大学,2013.[10]ZhangD,ShenD.PredictingfutureclinicalchangesofMCIpatientsusinglongitudinalandmultimodalbiomarkers[J].PLoSOne,2012,7(3):e33182.[11]FalahatiF,WestmanE,SimmonsA.MultivariatedataanalysisandmachinelearninginAlzheimer'sdiseasewithafocusonstructuralmagneticresonanceimaging[J].JAlzheimersDis,2014,41(3):685-708.[12]Sanchez-CatasusCA,StormezandGN,vanLaarPJ,DeDeynPP,SanchezMA,DierckxRA.FDG-PETforPredictionofADDementiainMildCognitiveImpairment.AReviewoftheStateoftheArtwithParticularEmphasisontheComparisonwithOtherNeuroimagingModalities(MRIandPerfusionSPECT)[J].CurrAlzheimerRes,2017,14(2):127-142.[13]LiQ,WuX,XuL,ChenK,YaoL.ClassificationofAlzheimer'sDisease,MildCognitiveImpairment,andCognitivelyUnimpairedIndividualsUsingMulti-featureKernelDiscriminantDictionaryLearning[J].FrontComputNeurosci,2017,11:117.[14]MinhasS,KhanumA,RiazF,KhanS,AlviA.PredictingProgressionfromMildCognitiveImpairmenttoAlzheimer'sDiseaseusingAutoregressiveModellingofLongitudinalandMultimodalBiomarkers[J].IEEEJBiomedHealthInform,2017.41 山西医科大学硕士学位论文[15]董师师,黄哲学.随机森林理论浅析[J].集成技术,2013,(01):1-7.[16]SaricaA,CerasaA,QuattroneA.RandomForestAlgorithmfortheClassificationofNeuroimagingDatainAlzheimer'sDisease:ASystematicReview[J].FrontAgingNeurosci,2017,9:329.[17]ArdekaniBA,BermudezE,MubeenAM,BachmanAH.PredictionofIncipientAlzheimer'sDiseaseDementiainPatientswithMildCognitiveImpairment[J].JAlzheimersDis,2017,55(1):269-281.[18]DimitriadisSI,LiparasD,TsolakiMN.Randomforestfeatureselection,fusionandensemblestrategy:CombiningmultiplemorphologicalMRImeasurestodiscriminateamonghealhyelderly,MCI,cMCIandalzheimer'sdiseasepatients:Fromthealzheimer'sdiseaseneuroimaginginitiative(ADNI)database[J].JNeurosciMethods,2017.[19]MathotaarachchiS,PascoalTA,ShinM,BenedetAL,KangMS,BeaudryT,FonovVS,GauthierS,Rosa-NetoP.Identifyingincipientdementiaindividualsusingmachinelearningandamyloidimaging[J].NeurobiolAging,2017,59:80-90.[20]YoungJ,ModatM,CardosoMJ,MendelsonA,CashD,OurselinS.AccuratemultimodalprobabilisticpredictionofconversiontoAlzheimer'sdiseaseinpatientswithmildcognitiveimpairment[J].NeuroimageClin,2013,2:735-745.[21]LiuF,WeeCY,ChenH,ShenD.Inter-modalityrelationshipconstrainedmulti-modalitymulti-taskfeatureselectionforAlzheimer'sDiseaseandmildcognitiveimpairmentidentification[J].Neuroimage,2014,84:466-475.[22]YangW,ChenX,CohenDS,RosinER,TogaAW,ThompsonPM,HuangX.ClassificationofMRIandpsychologicaltestingdatabasedonsupportvectormachine[J].IntJClinExpMed,2017,10(12):16004-16026.[23]RondinaJM,FerreiraLK,deSouzaDuranFL,KuboR,OnoCR,LeiteCC,SmidJ,NitriniR,BuchpiguelCA,BusattoGF.SelectingthemostrelevantbrainregionstodiscriminateAlzheimer'sdiseasepatientsfromhealthycontrolsusingmultiplekernellearning:Acomparisonacrossfunctionalandstructuralimagingmodalitiesandatlases[J].NeuroimageClin,2018,17:628-641.[24]AlamS,KwonGR,KimJI,ParkCS.TwinSVM-BasedClassificationofAlzheimer'sDiseaseUsingComplexDual-TreeWaveletPrincipalCoefficientsandLDA[J].JHealthcEng,2017,2017:8750506.[25]FerreiraLK,RondinaJM,KuboR,OnoCR,LeiteCC,SmidJ,BottinoC,NitriniR,BusattoGF,DuranFL,BuchpiguelCA.Supportvectormachine-basedclassificationofneuroimagesinAlzheimer'sdisease:directcomparisonofFDG-PET,rCBF-SPECTandMRIdataacquiredfromthesameindividuals[J].RevBrasPsiquiatr,2017,40(2):181-191.[26]HojjatiSH,EbrahimzadehA,KhazaeeA,Babajani-FeremiA.PredictingconversionfromMCItoADusingresting-statefMRI,graphtheoreticalapproachandSVM[J].JNeurosciMethods,2017,282:69-80.42 山西医科大学硕士学位论文[27]FerrariniL,FrisoniGB,PievaniM,ReiberJH,GanzolaR,MillesJ.MorphologicalhippocampalmarkersforautomateddetectionofAlzheimer'sdiseaseandmildcognitiveimpairmentconvertersinmagneticresonanceimages[J].JAlzheimersDis,2009,17(3):643-659.[28]GuoH,ZhangF,ChenJ,XuY,XiangJ.MachineLearningClassificationCombiningMultipleFeaturesofAHyper-NetworkoffMRIDatainAlzheimer'sDisease[J].FrontNeurosci,2017,11:615.[29]ZhangD,WangY,ZhouL,YuanH,ShenD.MultimodalclassificationofAlzheimer'sdiseaseandmildcognitiveimpairment[J].Neuroimage,2011,55(3):856-867.[30]HintonGE,OsinderoS,TehYW.Afastlearningalgorithmfordeepbeliefnets[J].NeuralComput,2006,18(7):1527-1554.[31]RussakovskyO,DengJ,SuH,KrauseJ,SatheeshS,MaS,HuangZ,KarpathyA,KhoslaA,BernsteinM.ImageNetLargeScaleVisualRecognitionChallenge[J].InternationalJournalofComputerVision,2015,115(3):211-252.[32]SalakhutdinovR,LarochelleH.EfficientLearningofDeepBoltzmannMachines[J].2010,9(8):693-700.[33]AmbasthaAK,LeongTY.ADeepLearningApproachtoNeuroanatomicalCharacterisationofAlzheimer'sDisease[J].StudHealthTechnolInform,2017,245:1249.[34]Martinez-MurciaFJ,GorrizJM,RamirezJ,IllanIA,SegoviaF,Castillo-BarnesD,Salas-GonzalezD.FunctionalBrainImagingSynthesisBasedonImageDecompositionandKernelModeling:ApplicationtoNeurodegenerativeDiseases[J].FrontNeuroinform,2017,11:65.[35]Lopez-de-IpinaK,Martinez-de-LizarduyU,CalvoPM,MekyskaJ,BeitiaB,BarrosoN,EstangaA,TaintaM,Ecay-TorresM.AdvancesonAutomaticSpeechAnalysisforEarlyDetectionofAlzheimerDisease:ANon-linearMulti-taskApproach[J].CurrAlzheimerRes,2018,15(2):139-148.[36]VianaJNM,VickersJC,CookMJ,GilbertF.Currentsofmemory:recentprogress,translationalchallenges,andethicalconsiderationsinfornixdeepbrainstimulationtrialsforAlzheimer'sdisease[J].NeurobiolAging,2017,56:202-210.[37]ZhangS,ZhuD,LiH,ZhangH,FengC,ZhangW.AnalysesofmRNAProfilingthroughRNASequencingonaSAMP8MouseModelinResponsetoGinsenosideRg1andRb1Treatment[J].FrontPharmacol,2017,8:88.[38]CostaL,GagoMF,YelshynaD,FerreiraJ,DavidSilvaH,RochaL,SousaN,BichoE.ApplicationofMachineLearninginPosturalControlKinematicsfortheDiagnosisofAlzheimer'sDisease[J].ComputIntellNeurosci,2016,2016:3891253.[39]GaoXW,HuiR,TianZ.ClassificationofCTbrainimagesbasedondeeplearningnetworks[J].ComputMethodsProgramsBiomed,2017,138:49-56.[40]OrtizA,MunillaJ,GorrizJM,RamirezJ.EnsemblesofDeepLearningArchitecturesfortheEarlyDiagnosisoftheAlzheimer'sDisease[J].IntJNeuralSyst,2016,26(7):1650025.43 山西医科大学硕士学位论文[41]LiF,TranL,ThungKH,JiS,ShenD,LiJ.ARobustDeepModelforImprovedClassificationofAD/MCIPatients[J].IEEEJBiomedHealthInform,2015,19(5):1610-1616.[42]吕鸿蒙,赵地,迟学斌.基于增强AlexNet的深度学习的阿尔茨海默病的早期诊断[J].计算机科学,2017,(S1):50-60.[43]惠瑞,高小红,田增民.基于深度学习的CT脑影像分类方法用于阿尔茨海默病的初步筛[J].中国医疗设备,2017,(12):15-19.[44]AmorosoN,DiaconoD,FanizziA,LaRoccaM,MonacoA,LombardiA,GuaragnellaC,BellottiR,TangaroS.DeeplearningrevealsAlzheimer'sdiseaseonsetinMCIsubjects:Resultsfromaninternationalchallenge[J].JNeurosciMethods,2017.[45]奉国和,吴敬学.KNN分类算法改进研究进展[J].图书情报工作,2012,(21):97-100+118.[46]KashefpoorM,RabbaniH,BarekatainM.AutomaticDiagnosisofMildCognitiveImpairmentUsingElectroencephalogramSpectralFeatures[J].JMedSignalsSens,2016,6(1):25-32.[47]BenvenutoJ,JinY,CasaleM,LynchG,GrangerR.IdentificationofdiagnosticevokedresponsepotentialsegmentsinAlzheimer'sdisease[J].ExpNeurol,2002,176(2):269-276.[48]LongX,ChenL,JiangC,ZhangL.PredictionandclassificationofAlzheimerdiseasebasedonquantificationofMRIdeformation[J].PLoSOne,2017,12(3):e0173372.[49]Martinez-MurciaFJ,GorrizJM,RamirezJ,OrtizA.AStructuralParametrizationoftheBrainUsingHiddenMarkovModels-BasedPathsinAlzheimer'sDisease[J].IntJNeuralSyst,2016,26(7):1650024.[50]VastaR,AugimeriA,CerasaA,NigroS,GramignaV,NonnisM,RoccaF,ZitoG,QuattroneA,ForTheAlzheimer'sDiseaseNeuroimagingI.HippocampalSubfieldAtrophiesinConvertedandNot-ConvertedMildCognitiveImpairmentsPatientsbyaMarkovRandomFieldsAlgorithm[J].CurrAlzheimerRes,2016,13(5):566-574.[51]孙倩倩,王晓成,孔盼盼,余红梅.基于Markov模型的中国阿尔茨海默病患病趋势预测[J].中国卫生统计,2015,(01):59-62+65.[52]李慧卓,相洁,秦嘉玮,梁佩鹏,李坤成.基于Adaboost的轻度认知障碍和阿尔茨海默病分类[J].中国医学影像技术,2016,(04):623-627.44 山西医科大学硕士学位论文致谢时间宛如指尖跳舞的流星转瞬即逝。又到一年桃李芬芳毕业季,三年的硕士研究生学习生涯即将结束。在此期间,收获满满,感慨良多。我所取得的进步离不开老师深切的关怀,离不开同学老铁式的帮助,更离不开家人默默的支持。首先,真诚的感谢我的恩师范炤老师,感谢您三年里对我的无私奉献和悉心指导。每当我遇到困难时,您总是给予我鼓励和帮助,亦师亦友。学习过程中,您总是尊重学生的想法,维护学生的自尊心,温文尔雅。您严谨的教学工作态度给我留下了深刻的影响,给我步入社会工作树立了人生榜样。您倾囊相授的不止是知识,还有为学为事为人之道。我再次衷心的感谢您!其次也感谢李琳老师对我在科研思路上的帮助!您的知识浩如书海,您的语言幽默诙谐,让我受益匪浅。感谢太原理工大学陈泽华老师在数据模型的选择上给予我莫大的支持,让我的实验得以顺利进行。感谢李艳伟师兄、张凌宇师兄对我学术上的帮助,你们严谨的求学态度,是我学习和坚持的榜样。感谢史丽娟师姐主动教我掌握许多实验技术,感谢杨亚超师姐对我在数据分析上的指导和帮助。感谢台晶晶同学夜以继日的相伴,我们一起学习,一起努力。感谢裴晓鹏同学在我的科研路上给予的莫大帮助,让我节省了时间,节约了费用。感谢李彩师妹、张莉萍师妹在生活上的帮助,愿你们前程似锦!感谢张妞妞同学、王文香同学,我的好闺蜜,因为有你们,我才不孤单,头顶艳阳天。感谢与大家的相遇,与你们成为朋友,我荣幸之至,感动与惊喜并存!感谢父母的养育之恩,你们在我成长的道路上披荆斩棘为我指明了方向,一直默默无闻的付出与忍受,让我学会了坚强,勇往直前!家,永远是爱的港湾!感谢我的爱人戴美瑜给予我理解和支持,我们一起筑起爱的小家。感谢研究生三年里所有默默帮助我、支持我的人,谢谢你们!最后,感谢对我的论文进行评审的专家和老师,您辛苦了,感谢您提出的宝贵意见!45 山西医科大学硕士学位论文在学期间承担/参与的科研课题与研究成果承担/参与的科研课题[1]山西省人力资源和社会保障厅:基于多因子综合模型的阿尔茨海默病高精度预测方法研究(编号:619017),2015年1月—2018年12月,金额12万.在研.参与.[2]山西医科大学创新基金:基于综合模型的阿尔茨海默病高精度预测方法研究(编号:619017),2016年1月—2018年12月,金额3万.在研.参与.[3]山西省留学人员管理办公室:轻度认知障碍转化为阿尔茨海默病的预测和干预研究(编号:2016-061),2016年1月—2018年12月,金额2万.在研.参与.研究成果[1]齐雪丹,许凡宇,范炤.轻度认知障碍及阿尔茨海默病的sMRI分析[J].中国当代医药,2017,24(08):9-13+26.[2]范炤,杨亚超,许凡宇,齐雪丹.一种基于MRI数据库的阿尔茨海默病进程数理模型预测方法[J].中华生物医学工程杂志,2016,(2):101-107.46 山西医科大学硕士学位论文个人简历齐雪丹,女,1990年11月07日出生,汉族,山西省永济市人。2009年9月考入长治医学院临床医学专业,2015年7月本科毕业并获得医学学士学位。2015年9月考入山西医科大学基础医学院神经生物学专业,攻读硕士研究生。47

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭