基于fisher判别准则胃病分类模型

基于fisher判别准则胃病分类模型

ID:21326502

大小:349.50 KB

页数:11页

时间:2018-10-21

基于fisher判别准则胃病分类模型_第1页
基于fisher判别准则胃病分类模型_第2页
基于fisher判别准则胃病分类模型_第3页
基于fisher判别准则胃病分类模型_第4页
基于fisher判别准则胃病分类模型_第5页
资源描述:

《基于fisher判别准则胃病分类模型》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于Fisher判别准则的胃病分类模型摘要本文就胃癌患者、萎缩性胃炎患者以及非胃病患者的分类问题,综合运用系统聚类和Fisher判别的方法建立了基于四个指标的分类判别模型。针对问题一,模型采用系统聚类和Fisher判别的方法,根据题中已知类型的三个样本13,14,15,将混淆的12个样本1~12区别开来,并且使得样本13,14,15在三个类别中。使用SPSS软件求得分类结果,胃癌患者:1,2,4,5,13;萎缩性胃炎患者:3,7,10,11,12,14;非胃病患者:6,8,9,15。针对问题二,本题基

2、于问题一的分类情况,采用Fisher判别的方法,确定三个样本16,17,18的类别。使用SPSS软件求得判别结果,第16号样本和第18号样本属于第二类,即萎缩性胃病患者;第17号样本属于第三类,即非胃病患者。最后对模型的优缺点进行分析,提出了改进方案。关键词系统聚类;Fisher判别;SPSS软件;判别模型1.问题的重述胃癌患者易误诊为萎缩性胃炎患者以及非胃病患者。进行胃癌的鉴别主要是通过化验4项生化指标:血清铜蓝蛋白(X1)、蓝色反应(X2)、尿吲哚乙酸(X3)、中性硫化物(X4)。本来从胃癌患者、

3、萎缩性胃炎患者以及非胃病患者中一共抽取了12人进行指标化验,但是由于医护人员的疏忽,将化验结果搞混了。现有以前对胃癌患者、萎缩性胃炎患者以及非胃病患者化验的结果各一例,依次为(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化验结果见附件表十。医学上一般根据临床的经验认为,患同一种病的人所表现出来的特征往往是相似的,现需建立一种判别准则,把上述混淆的结果区分开来,再将三个病人的化验指标如下:(210,142,0.10,0.08

4、)、(180,120,0.08,0.21)、(150,130,0.05,0.14),区分他们各属于哪一类人群。2.模型假设和符号说明2.1.模型的假设(1)患同一种病的人所表现出来的特征往往是相似的;(2)被检测的人员没有其它任何疾病;(3)四项生化指标无关联。2.2符号使用说明(不打编号)(1):血清铜蓝蛋白;(2):蓝色反应;(3):尿吲哚乙酸;(4):中性硫化物(5)1~12:表示未知分类样本,即被混淆的样本;(6)13~15:表示已知分类样本;(7)16~18:表示待判的样本;(8)、、:分别

5、表示使用特征值时胃癌患者、萎缩性胃炎患者以及非胃病患者的重心;(9)、、:分别表示使用特征值时胃癌患者、萎缩性胃炎患者以及非胃病患者的重心;(10)、:分别表示用特征值时第一类与第二类,第二类与第三类之间的分界点。(11)、:分别表示用特征值时第一类与第二类,第二类与第三类之间的分界点。(13)、、:分别表示第一类、第二类和第三类的个数;(16)、:分别表示第个指标第个样本的数据和标准化后的数据;(17):表示15个样本值的第个指标的样本均值;(18):表示15个样本值的第个指标的样本标准差;(19)

6、:分别表示Fisher判别时使用、为标准化的函数系数;3.问题的分析2.1问题一的分析本问题要求解的是将混淆的12组样本判别其类型。由于患同一种病的人所表现出来的特征往往是相似的,首先想到的是运用系统聚类的方法,将未知类别的样本分为三类,再将已知类别的样本代入进行判别。但是此时却无法将已知类别的三组样本分开。所以最重要的是将已知类别的样本分开。于是将12组未知类别的样本和3组已知类别的样本一起运用系统聚类,将与13号样本为一类的作为第一类,与14号样本为一类的作为第二类,与15号样本为一类的作为第三类

7、。第一步,先将其聚成两类。若未将三类中的一类分开,重复第一步操作,直至有一个样本分开。第二步,对剩下的两个样本所在类聚成两类,若未将这两个样本分开。重复第二步,直至将这两个样本分开。第三步,此时将还未知类别的样本进行Fisher判别。2.2问题二的分析本问题基于问题一的聚类结果,运用Fisher判别的方法,利用SPSS软件得到其判别结果。4.模型的建立与求解4.1问题一的解决方案及模型(多用几种方法)(模型要有名字)本问题要求的是将混淆的12组未知类别的样本区别开来。由于患同一种病的人所表现出来的特征

8、往往是相似的,首先想到的是运用系统聚类的方法,将未知类别的样本分为三类,再将已知类别的样本代入进行判别。但是此时却无法将已知类别的三组样本分开。于是将已知类别的三组样本看成三类,再聚类得到与其类似的样本。第一阶段:标准化。分析数据的量级和量纲,知该15个样本的数据最大相差,则说明相差较大,则需要对其进行标准化:(可写在模型的准备里面,我们用什么对其进行标准化)(1)第二阶段:系统聚类。利用标准化后的数据,用欧式距离求得两点间的距离,再找最小的距离,将其聚

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。