基于决策树的数据挖掘算法研究与应用

基于决策树的数据挖掘算法研究与应用

ID:33459435

大小:844.00 KB

页数:101页

时间:2019-02-26

基于决策树的数据挖掘算法研究与应用_第1页
基于决策树的数据挖掘算法研究与应用_第2页
基于决策树的数据挖掘算法研究与应用_第3页
基于决策树的数据挖掘算法研究与应用_第4页
基于决策树的数据挖掘算法研究与应用_第5页
资源描述:

《基于决策树的数据挖掘算法研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于决策树的数据挖掘算法研究与应用数据挖掘是指从数据库中抽取隐含的、具有潜在使用价值信息的过程,是一种新型的数据分析技术,已经被广泛应用于金融、保险、政府、教育、运输以及国防等领域。数据分类是数据挖掘中一个重要的内容。分类存在很多方法,常见的分类模型有决策树、神经网络、遗传算法、粗糙集、统计模型等。其中决策树算法是以实例为基础的归纳学习算法,以其易于提取显示规则、计算量相对较小、可以显示重要决策属性和较高的分类准确率等优点而得到广泛的应用。据统计,目前决策树算法是利用最广泛的数据挖掘算法之一。然而在实际的应用过程中,

2、现存的决策树算法也存在很多不足之处,如计算效率低下、多值偏向等。因此,进一步改进决策树,提高决策树的性能,使其更加适合数据挖掘技术的应用要求具有重要的理论和现实意义。本文针对上述数据库知识发现的不足,进行深入的研究,探索数据挖掘中决策树分类的优化算法,以便更好地提高分类的准确性,更好地应用于实际工作中。本文主要的研究工作如下:第一,从宏观上介绍了数据挖掘和分类技术的理论基础,并重点对几种常见决策树算法进行了分析和比较,例如ID3、C4.5、CART算法。第二,详细地分析了利用决策树方法对数据进行分类挖掘时常见的几个问

3、题:属性值空缺、连续属性的处理、过度拟合数据等。这些问题都会导致决策树的分类精度下降,因此在构建决策树时必须选择合理的策略,提高决策树的分类精度。第三,本文对决策树算法进行了优化研究,对属性值空缺、属性选择多值化、属性选择标准等问题提出了具体的解决办法。本文还提出了加权简化熵的概念,并对ID3算法进行了改进,经过比较,改进算法在总体性能上优于目前广泛应用的ID3算法。第四,利用新的决策树算法在一个棉纺厂的设备管理系统中进行数据挖掘,为厂家的决策支持提供了科学、准确的根据。关键字:数据挖掘,决策树,ID3算法,过度拟合

4、,加权简化熵AbstractDataMiningmeanstheprocessofextractingcrypticandpotentialhelpfiilinformationfromamassofData.ItisonekindofbrandnewDataanalysistechnologyandpopularinthefieldofbankingfinance,insurance,government,education,transportationandnationaldefenseetc.Dataclass

5、ificationisoneofimportantcontentsinDataMining.TherearemanymethodsforDataclassification,suchasdecisiontreeinduction,associationrale,classificationtechnique,BayesianclassificationandBayesianbeliefnetworks,geneticalgorithms,neuralnetworks,roughsets,andsoon.TheDeci

6、sionTreeclassificationalgorithmbasesontheinstancesamongsttheseiswidelyusedwithitsadvantagesofconvenienceforgettingapparentrules,smallercalculationworkload,showingimportantdecisioncharacteristics,higherclassificationcorrectnessetc.DecisionTreealgorithmiscurrentl

7、yoneofthemostpopularinDataMiningalgorithmsaccordingtorelatedstatistics.Therearesomeissuesinthemostexistentdecisiontreealgorithms,whileappliedtotherealitytasks,namelymulti-valuebias,lowerefficientlyincomputationetc.Therefore,itpossessesimportanttheoreticandfactu

8、alsignificancetomakefurtherimprovementandraisetheperformancefordecisiontree,soastomakedecisiontreemoresuitablefortherequirementofthefactualapplicationThisarticledeeplymakesr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。