欢迎来到天天文库
浏览记录
ID:33103556
大小:1.39 MB
页数:66页
时间:2019-02-20
《基于粗集理论值约简的数据挖掘系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、长春理工大学硕士学位论文基于粗集理论值约简的数据挖掘系统姓名:宋雪飞申请学位级别:硕士专业:计算机应用技术指导教师:崔广才20021201摘要数据挖强是当雷知识发瑰赣域串的一令辫究热点,本论文的主善是研究如何通过基于粗集的值约简实现数据挖掘。值约简事实上是农求得属槛筒式秘基础上,赞对每条规剐,将挽盼尽可能的泛化,使每条规雯《更趋简练,也更具有代表性,更重要的是,它通过离散化对全体数据进行约简,使嫠个数椐量降低,从而提高了挖掘的效率,降低了时间复杂度。文申给出了基于粗集的数据归约、概念层次的趣动生成、识别矩阵求
2、简式的方法。在理论王馋畿基础上,我们设诗莠实现了一拿基于趣袋戆数据约麓的原型系统。该原型系统分为数据预处理、数据约简、规则生成和决策算法褥大纽戍部分。该原整系统基本上实现了上述各秘方法,用于验证方法的有效性及测试算法的效率。关键词:数据挖掘粗集数据约简ABSTRACTDataminingiscurrentlyahotresearchtopicoftheknowledgediscoveryDomain.ThispapermainlystudiesthewayfromdatareductionBasedonRou
3、ghSetstodataminingValuereductionwhichgeneralizeseveryrulemakesallrulesmoreconcise.Themostimportantisitdeducesthenumberofdata,Thenitimprovestheefficiencyofdatamininganddeducesthecomplexoftime.ThispapergivesmethodofdatareductionBasedonRoughsets.Implementation
4、ofconceptHierarchyandamethodforcomputingreductionusingindiscerniblematrix..Basedonthesetheoreticalwork,wedesignandimplementaprototypeKDDsystemwhichisdividedintofoursections:preprocessingsection,datareductionsection,ruleinductionanddecisionalgorithmsection.T
5、hisprototypesystemimplementsabovemethodsandcantestvalidityandefficiencyofalgorithm.Keywords:DataMiningRoughSetsdatareduction第一章序言§1.1研究的目的和意义面对信息社会中数据和数据库的爆炸式增长,人类分析数据和从中提取有用信息的能力远远不能满足实际需要。虽然数据库管理系统(DBMS)可以高效实现数据录入、检索和维护等管理功能,但不能发现数据中的关联和规则,也不能根据现有的数据预测未来的
6、发展趋势。例如,在超级市场通过条形码扫描,把每一笔商品交易输入数据库,一个中型超市经营的商品就有数万种,每天的交易量上万笔。一个月的数据量有几个G。如此大量的数据在传统的数据库中并不能很好地回答经理关心的问题:商品在不同季节或一天的不同时间的销售量有何变化规律?商品A的销售量的增加是否会同时带动商品B的销售?如何调整商品的资金占用,以达到最佳的资源配置?各种商品的销售之间是否存在一定的关联?因此,迫切需要一种能够智能地自动地把数据转换成有用信息和知识的技术和工具。需求是发展之母,数据库管理系统和人工智能中机器
7、学习两种技术的发展和结合,促成了在数据库中知识发现(KDD)这一新技术的诞生。§1.2国内外研究现状1989年8月,在美国底特律召开的第1l届国际人工智能联合会议的专题讨论会上首次提出KDD。它是一门交叉}生学科,涉及机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等领域,内涵极为广泛,理论和技术难度很大,从而使针对大型数据库的KDD技术一时还难以满足应用需要。于是,1995年的(美)计算机学会(ACM)会议提出了数据挖掘(datamining)””概念,它形象地把大型数据库
8、看成是存放有价值信息的矿藏,通过有效的知识发现技术,从中挖掘或开采出有用的信息。所谓数据挖掘,就是从数据库中抽取隐舍的、以前未知的、具有潜在应用价值的信息的过程,也有一些文献把数据挖掘称为知识抽取、数据考古学.数据捕捞,等等。多数人认为数据挖掘是KDD过程中的关键步骤,从而不加区分地使用知识发现和数据挖掘这两个术语(如图1.1图1.1KDD过程数据挖掘与传统数据分析工具““的主要区别在于它们探索数据
此文档下载收益归作者所有