基于粗糙集的启发式高效属性约简算法的研究

基于粗糙集的启发式高效属性约简算法的研究

ID:33287346

大小:3.60 MB

页数:61页

时间:2019-02-23

基于粗糙集的启发式高效属性约简算法的研究_第1页
基于粗糙集的启发式高效属性约简算法的研究_第2页
基于粗糙集的启发式高效属性约简算法的研究_第3页
基于粗糙集的启发式高效属性约简算法的研究_第4页
基于粗糙集的启发式高效属性约简算法的研究_第5页
资源描述:

《基于粗糙集的启发式高效属性约简算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、TheResearchonEfficientHeuristicAttributeReductionAlgorithmBasedonRoughSetZHANGYahAthesissubmittedinpartialsatisfactionoftheRequirementsforthedegreeofMasterofEngineeringlnComputerApplicationTechnologylnCentralSouthUniversityofForestryandTechnology498ShaoshanSouthR

2、oad,TianxinDistrictChangshaHunan410004,P.R.CHINASupervisorProfessor删JunshanMay,2013中南林j—匕科技大掣Y2舢3㈣17删0舢舢2删5删学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品,也不包含为获得中南林业科技大学或其他教育机构的学位或证书所使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确

3、方式表明。本人完全意识到本声明的法律后果由本人承担。中南林业作者签名:纫叶钞弘,哆年f月叼日科技大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件或电子版,允许论文被查阅或借阅。本人授权中南林业科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于:1、保密口,在年解密后适用本授权书。2、不保密“(请您在以上相应方框打“寸’)作者签名:删勿乃年箩月衫日导师虢二邵

4、I圳沙I:『年j-月枷硕士学位论文基于粗糙集的启发式高效属性约简算法的研究摘要随着数据库技术、数据仓库技术的迅速发展,存储的数据急剧增长,传统的数据分析和查询方法已经不能满足人们对隐含在数据中的知识的渴求。知识发现是研究如何快速、准确地从杂乱无章的海量数据中挖掘潜在的有利用价值的信息,并用于预测未来的行为。1982年,波兰学者Pawlak.Z提出了粗糙集理论,作为一种新的数据挖掘方法,能在保持分类能力不变的情况下,通过属性约简,达到知识获取并简化知识的目的,成为新的热点研究问题。然而粗糙集的属性约简是一个NP.hard问

5、题,常见的启发式属性约简算法有基于差别矩阵的约简算法、基于属性重要度的约简算法、基于信息熵的约简算法和基于遗传算法的属性约简。本文介绍了两种改进的启发式属性约简算法,其一是改进的差别矩阵DMI算法和属性频率作为重要度相结合的算法,能大幅度降低差别矩阵的计算量:其二是无需求核的基于条件熵的属性约简算法,对于无核属性的决策表,根据每个属性加入约简集之后求其相对于决策属性的条件熵是呈递减特性,从而求得相对约简。通过实例分析了这两种算法的执行过程和可行性,也提出了它们的局限性。为了解决决策表中不相容的数据问题,本文提出了一种新的

6、属性约简算法:首先基于等价类划分的方法,重新划分条件属性相同而决策属性不同的对象归为一个对象,消除不相容的数据后,再通过计算属性集上下近似的方法,求得属性集的边界域率,选取令边界域率最小的属性加入到约简集中,并不断缩小论域,直到为空为止。最后在所得约简集中依次判断每个属性是否是冗余的,从而得到决策表的一个相对约简。分析了算法的时间复杂度,并经过实验数据证明了算法是高效和可行的,对比前面两种算法,在性能上有了较大的提高。并验证了该算法所得的约简一般是最优解或次优解。最后将此算法应用于教学评价系统中,对教学评分数据进行分析得

7、出影响教学质量的主要因素,从而验证了粗糙集属性约简具有应用意义。关键词:粗糙集;启发函数;差别矩阵;信息熵;边界域率硕士学位论文基于粗糙集的启发式高效属性约简算法的研究ABSTRACTWiththerapiddevelopmentofthedatabasetechnologyanddatawarehousetechnology,thedatastoredintherapidgrowth,thetraditionaldataqueryandanalysismethodshavebeenunabletomeetthepeop

8、ledesiretheknowledgeimplicitinthedata.Knowledgediscoveryistostudyhowtoquicklyandaccuratelyminingthepotentialofusefulinformationinthechaoticmassdataandusedtopre

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。