数据挖掘导论

数据挖掘导论

ID:29978737

大小:2.52 MB

页数:212页

时间:2018-12-25

数据挖掘导论_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《数据挖掘导论》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘第一章数据挖掘导论数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动扮演着越来越重要的角色。本书将介绍数据挖掘()与数据库知识发现(    )的基本知识,以及从大量有噪声、不完整、甚至是不一致数据集合中,挖掘出有意义的模式知识所涉及的概念与技术方法。本章将从数据管理技术演化角度,介绍数据挖掘的由来。以及数据挖掘的作用和意义。同时还将介绍数据挖掘系统的结构、数据挖掘所获得的知识种类,以及数据挖

2、掘系统的分类。最后还简要介绍了当前数据挖掘领域尚存在的一些热点问题。计算机与信息技术经历了半个世纪的发展,给人类社会带来了巨大的变化与影响。在支配人类社会三大要素(能源、材料和信息)中,信息愈来愈显示出其重要性和支配力,它将人类社会由工业化时代推向信息化时代。随着人类活动范围的扩展,生活节奏的加快,以及技术的进步,人们能以更快速更容易更廉价的方式获取和存储数据,这就使得数据及其信息量以指数方式增长。早在世纪八十年代,据粗略估算,全球信息量每隔个月就增加一

3、倍。而进入九十年代,全世界所拥有的数据库及其所存储的数据规模增长更快。一个中等规模企业每天要产生以上来自各生产经营等多方面的商业数据。美国政府部门的一个典型大数据库每天要接收约数据量,在秒到分钟时间里,要维持的数据量达到,存档数据达。在科研方面,以美国宇航局的数据库为例,每天从卫星下载的数据量就达之多;而为了研究的需要,这些数据要保存七年之久。九十年代互联网(!  )的出现与发展,以及随之而来的企业内部网(! )和企业外部网("#

4、 )以及虚拟私有网($%:$&    ')的产生和应用,使整个世界互联形成一个小小的地球村,人们可以跨越时空地在网上交换信息和协同工作。这样,展现在人们面前的已不是局限于本部门,本单位和本行业的庞大数据库,而是浩瀚无垠的信息海洋。据估计,((年全球数据存贮容量约为二千,到年增加到三百万,面对这极度膨胀的数据信息量,人们受到“信息爆炸”、“混沌信息空间”(!)*+, )和“数据过剩”( &)的巨大压力。数据挖掘

5、第一章数据挖掘导论然而,人类的各项活动都是基于人类的智慧和知识,即对外部世界的观察和了解,做出正确的判断和决策以及采取正确的行动,而数据仅仅是人们用各种工具和手段观察外部世界所得到的原始材料,它本身没有任何意义。从数据到知识到智慧,需要经过分析加工处理精炼的过程。如图--所示,数据是原材料,它只是描述发生了什么事情,并不能构成决策或行动的可靠基础。通过对数据进行分析找出其中关系,赋予数据以某种意义和关联,这就形成所谓信息。信息虽给出了数据中一些有一定意义的东西,但它往往和人们需要完成的任务没有直接的联系,也还不能

6、做为判断、决策和行动的依据。对信息进行再加工,即进行更深入的归纳分析,方能获得更有用的信息,即知识。而所谓知识,可定义为“信息块中的一组逻辑联系,其关系是通过上下文或过程的贴近度发现的”。从信息中理解其模式,即形成知识。在大量知识积累基础上,总结出原理和法则,就形成所谓智慧(.)。事实上,一部人类文明发展史,就是在各种活动中,知识的创造、交流,再创造不断积累的螺旋式上升的历史。客观世界收集数据分析信息深入分析知识客观世界数据信息知识决策与行动图--人类活动所涉及数据与知识之间的关系描述计算机与信息技术

7、的发展,加速了人类知识创造与交流的这种进程,据德国《世界报》的资料分析,如果说(世纪时科学定律(包括新的化学分子式,新的物理关系和新的医学认识)的认识数量一百年增长一倍,到本世纪/年代中期以后,每五年就增加一倍。这其中知识起着关键的作用。当数据量极度增长时,如果没有有效的方法,由计算机及信息技术来帮助从中提取有用的信息和知识,人类显然就会感到像大海捞针一样束手无策。据估计,目前一个大型企业数据库中数据,约只有百分之七得到很好应用。因此目前人类陷入了一个尴尬的境地,即“丰富的数据”(*)而“贫乏的知识

8、0('  ,)。 数据挖掘第一章数据挖掘导论早在八十年代,人们在“物竞天择,适者生存”的大原则下,就认识到“谁最先从外部世界获得有用信息并加以利用,谁就可能成为赢家”。而今置身市场经济且面向全球性剧烈竞争的环境下,任何商家的优势不单纯地取决于如产品、服务、地区等方面

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。