基于数据挖掘技术的肺癌早期预警模型研究

基于数据挖掘技术的肺癌早期预警模型研究

ID:33387554

大小:11.38 MB

页数:125页

时间:2019-02-25

基于数据挖掘技术的肺癌早期预警模型研究_第1页
基于数据挖掘技术的肺癌早期预警模型研究_第2页
基于数据挖掘技术的肺癌早期预警模型研究_第3页
基于数据挖掘技术的肺癌早期预警模型研究_第4页
基于数据挖掘技术的肺癌早期预警模型研究_第5页
资源描述:

《基于数据挖掘技术的肺癌早期预警模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、郑州大学博士学位论文基于数据挖掘技术的肺癌早期预警模型研究姓名:王娜申请学位级别:博士专业:流行病与卫生统计学指导教师:吴逸明201204摘要摘要肺癌是当今世界各国最常见的恶性肿瘤,其发病率和死亡率呈不断上升趋势,对人类的健康和生命构成了极大威胁。在中国,肺癌每年大约导致40万例患者死亡,已成为发病率和死亡率最高的恶性肿瘤。研究显示I期肺癌术后10年生存率可达到92%。然而肺癌早期不易诊断,恶性程度高,一经病理确诊多数已属晚期,失去手术治疗的最佳时机,总的5年生存率仅为15%左右。因此,要降低肺癌

2、患者的死亡率关键在于肺癌的早期发现、早期诊断和早期治疗。肺癌的发生是多因素、多基因和多阶段发展的复杂过程,由于传统的影像学检查和支气管镜等检查手段存在敏感性、特异性和适用度等方面的局限,近年来国内外学者对肺癌早期预警或诊断相关的分子标志和多种肿瘤生物标志的联合检测做了大量有益的探索,以期找到更合理、敏感性和特异性更高的分子联合标:匕JC净。肺癌的发生是环境因素和遗传因素共同作用的结果,因此在寻找肺癌早期预警或诊断的生物标志时,也可以从两方面着手,即反映机体先天具有或后天获得的对外源性物质产生反应能

3、力的易感性标志;反映早期生物效应、结构和/或功能改变以及疾病的效应标志。遗传因素属于前者,其作用体现在同一环境暴露中个体肿瘤易感性的差异,归根到底由基因多态所代表的遗传背景决定。另一方面,在很多情况下,许多分子事件的发生早于明显恶性表型的出现,因此,运用分子生物学的方法检测肺癌发生过程中的早期分子事件,从而发现癌前病变或早期癌变也被认为是肺癌早期预警最具应用前景的手段。肿瘤发生的早期生物效应包括了DNA甲基化和端粒损伤在内的遗传学和表观遗传学改变。数据挖掘(DataMining),又称数据库知识发

4、现(KnowledgeDiscoveryfromDatabase,l①D),它是从大量数据中提取并挖掘未知的、有价值的模式或规律等知识的复杂过程。它通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘与传统数据分析有着本质的区别。数据挖掘是在没有明确的假设的前提下挖掘信息和发现知识。同时,通过数据挖掘得到的信息具有先前未知、有效及可实用3个特征。数据挖掘中的决策树和人工神经网络摘要技术(ArtificialN

5、cumlNetworks,ANN)能够对数据信息进行大规模并行处理和分布式存储,且具有良好的自适应性、自组织性及较强的学习功能、联想功能和容错功能。在肿瘤的诊断方面,不仅能够起到检测可疑病变和分类的作用,还能挖掘用于检测和分类的潜在特征标志,为肿瘤的诊断做出建设性贡献。本研究检测对象外周血中CYPlAl,GSTMl,GSTTl,mEH,XRCCl基因多态性、p16和RASSFlA基因甲基化水平及端粒相对长度,探讨5种基因多态性与p16、RASSFlA基因甲基化和端粒相对长度的相关关系,在此基础上应

6、用数据挖掘技术,检测这些分子指标对肺癌早期预警的相关性,抽取可用于肺癌预警的有效特征,构建较为适合的预测模型,探讨是否有助于提高肺癌早期预警或诊断的正确率及联合检测对肺癌辅助诊断的意义,以实现肺癌早期预警、诊断和分类的自动化,为高危人群的筛查和临床肺癌诊断提供有价值的参考资料。.目的1.探讨肺癌患者外周血I相代谢酶基因CYPlAI,II相代谢酶基因GSTMl、GSTTI、mEH,及DNA修复酶基因XRCCI的多态基因型与肺癌易感之间的关系,探讨抑癌基因p16、RASSFlA甲基化及端粒相对长度与肺

7、癌发生的关系,筛选出与肺癌发生相关的有效分子生物标志,找出对肺癌早期预警意义最大的几项,为肺癌的早期预警提供基础资料。2.将数据挖掘技术和上述分子标志相结合,构建可“自动”处理信息的智能预警模型,为肺癌智能预警系统的研制开辟一条新途径,提高肺癌早期预警的准确率。材料与方法1.以251例肺癌患者和256例健康体检者为研究对象。2.采用等位基因特异性扩增法(allele.specificamplification,ASA)检测CYPlAl-exon7位点多态性,采用多重PCR法检测GSTMI、GSTT

8、l基因多态性,采用聚合酶链反应.限制性片段长度多态性(polymerasechainreaction-restrictionfragmentlengthpolymorphism,PCR.RFLP)方法分别检测CYPIAl-Mspl位点、mEH.exon3、mEH.exon4、XRCCI.194、XRCCI.280及XRCCI.399位点基因多态性。采用实时荧光定量甲基化特异PCR(real—timemethylationspecificPCR,qMSP)技术检测p16和RASSFI

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。