试析基于web的数据挖掘技术

试析基于web的数据挖掘技术

ID:35187478

大小:1.53 MB

页数:40页

时间:2019-03-21

试析基于web的数据挖掘技术_第1页
试析基于web的数据挖掘技术_第2页
试析基于web的数据挖掘技术_第3页
试析基于web的数据挖掘技术_第4页
试析基于web的数据挖掘技术_第5页
资源描述:

《试析基于web的数据挖掘技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、武汉科技大学硕士学位论文基于Web的数据挖掘技术姓名:吴海红申请学位级别:硕士专业:计算机应用指导教师:王耀青20030101武汉科授大学硕士论文摘要数据挖掘是近年来随着数据库和入工智能技术的发展而出现的一种全新信息技术,也是计算极秘学与技术,尤其是计募投婀终熬发展秘普遮搜用赝提出的嚣且迫切需要解决的重要课题。数据挖掘是指从数据中提取模式的过程,数据挖掘翡撵懑,让入稍最终有熊力浚莰数据静真垂徐蓬,帮蕴藏程数据中豹傣怠纛翔鼋鞋。数据挖掘技术的产生,使得企业用户可以从大量的数据中发现隐含的规律,从而为企业决策提供曼可靠

2、的依据。由于web上存在许多半结构纯数据,丽数据挖舔.必须建立衣结构化良好的数据熬础之上,可以说,即便在u曲上得到⋯些相关数据,将其用于挖掘和分析也是相当困难的,颟向web的数据挖捅要比酾向单个数援仓痒孛懿数据挖掘要复杂豹多,黄绞弱数掘痒郯育一定豹数撰模型,可敬投握模型来具体描述特定的数据,同时可以很好的定义和解释相关的查询语言;由于Internet幂1www的广泛赢露,密现了藻予舅构数摇源鲍数疆挖掘,翔文档数据挖掘、时间序列数据挖掘、电子商务系统中的数据挖掘。伴随数据库技术的发媵,多媒体数据库的数据挖稍、空间数据

3、席的数獬挖掘簿也弓l起了许多入的关注。Intefn戗的迅旗发展,尤其魑w曲的全球譬及,使褥W曲上信息量无比丰富。通过对web的挖掘,可从w曲页面中提取所需的知识:对总的用户访问行为、频凌、瘫容瓣分掇,可撵到关予群传瓣户谤藏撂秀葶鞋方式豹酱遮知识,焉致敬送我们的web服务设计。而更重用的是,通过对这些用户特征的理解和分析,可以有勤子开展有铮对性静毫子商务活动。’web数据挖搠于与传统的数据挖搠有着很大的不同,传统的数据摭掘技术处理的数据对象主要是结构化数攒,很少处理上的异质、非结构讫信息,因此,对w曲上的数据进舒挖掘

4、欺嘉极大的挑战性,这些使褥web挖掘成为数撼挖掘的一个新主题,引起了人们的极大兴趣。web上有海爨戆数攥信悫,怎撵辩这些数据逮锷应援,残7凌今数据痒技术的研究热点,数据挖掘就是从火量的数据中发现隐含的规律性的内容,解决数据静应糟质蠢闯题,充分翻用有掰的数鼯,废弃虚伪光蘑的数蕹,楚数攒挖掘技术的最踅要的应用。W曲信息的多样性决定了W曲挖掘任务的多样性。W曲内容挖掘的重点是页面分类和聚类。、№b内窖挖掘的主要方向在文本挖掘。w曲结构挖援的毽豹在予揭瑟蕴会在这些文楼结构揍患巾戆套爝模式。超镳按还及殃了文挡问的引用关系,一

5、个页面被引用的次数体现了该页面的重爱性。Web页面的URL可戆会反映茭嚣懿类型,也霹施会爱浃茭瑟之闯静毽录缩梅关系。w曲使爱诧录挖掘是指从的访问记录中提取感兴趣的模式。分析这些数据可以帮助瑕解用户的行为,灰丽改进站点的缩构,或为用户提供个性纯的服务。稻户访问嘲站的酲志藏汉科技大学硕士论文文传为我{

6、、】提镆⋯个霹以了勰瘸户行荧麴规会,这群我弱有可能改变阚蛞豹结稳以便更好的为用户服务,使用户更方便的找到自己的感兴趣的内容。关键词:数据挖掘,web日志挖掘,序列模式识别,自适应web站点武汉科授大学硕士论文Abstra

7、ctD鑫}al稳in;n壁itisneilhefoneakindofbrand—ne、vinforma£ion£echnolOgiestha£appearwithdevelopmentOfthedatabaseandartincialintelligencetechnologyinreeen毛yeafsn甜t∞∞mputefseiencean程lechnology,e华ecially磕esu≮ect£hlsDlVeu唱entlybythedevelopmentanduseputfo八Vardofcomputerne

8、twork^Dataminingisaprocessthaldrawmodesindata,andletpeoplehaVetheabilitytOknowthestefl{ngwoflhoft}抢da£a氍nal幻‘namelyinfofmationandknowledgeinit.Thetechnologyofdatamining,makeenterprisenndfawthatimplyofdata,On色rreIiablebasisf.ormal(i瓣gpolicy趣l氧eente带^se.Fofweb酝v

9、eal跌ofh嚣lfs

10、mc芏u辑d鑫{a,anddataminingmustbaseonthegoodstmcturedatumfoundation.Wecansay’EVenifgetsomerelev8ntdataonweb,useltfoffniningandanalyzing穗鼓ilisquile式舔cult。Orientedthewebminin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。