欢迎来到天天文库
浏览记录
ID:32978369
大小:4.10 MB
页数:55页
时间:2019-02-18
《web日志挖掘应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、桂林理工大学硕士学位论文Web日志挖掘应用研究姓名:金骅申请学位级别:硕士专业:计算机应用技术指导教师:陈基漓20090401桂林理工大学硕士学位论文摘要伴随着Internet技术的发展,www的应用也越来越多,Web站点越来越普及。在当前竞争激烈的网络经济中,只有赢得用户才能获得竞争中的优势。客户浏览行为的数字化,使得通过收集大量用户浏览行为数据来深入研究客户行为变为可能。如何利用这个机会,从这些“无意义’’并且繁琐的数据中得到有价值知识和信息成为目前面临的最紧要的问题之一。为了解决这个问题Web数据挖掘技
2、术诞生了。本文介绍了Internet的发展状况及Web数据挖掘的产生背景,系统地阐述了数据挖掘技术与Web数据挖掘的思想、理论、技术、方法和策略,对Web日志数据挖掘过程及其中各环节的关键技术进行了深入的探讨,重点研究了Web日志挖掘的数据预处理技术和关联规则及基于关联规则的算法。Web日志数据预处理方面,在分析比较各种方法基础上,设计出相关数据库表,并给出了简明清晰的算法实现。在关联规则及基于关联规则算法研究方面,本文分析了经典的基于关联规则的挖掘算法Apriori的特点,找出算法存在的不足,并对其进行了改
3、进和优化,使其具有更高的效率。最后对Web服务器的日志记录进行挖掘实验,得到较为理想的结果。关键词:Web数据挖掘,关联规则,Web日志预处理,Apriori算法桂林理工大学硕士学位论文AbstractWiththedevelopmentofthetechnologyinthefieldofinternet,1j
4、n唧becomesmoreandmorepopular.Asaresult,manywebsitesarebeingbuilt。Astheviolentcompetitionintheinterne
5、teconomy,onlytheonewhoattractsthecustomerscan.survive.Thebehaviorsofthecustomersbecomedigital,whichmakesitpossibletocollectalotofdatainordertofurtherinvestigatethebehaviorofthecustomers.OneofthemostimportantproblemswhichweconfrontiShowtofindthevaluableandun
6、derstandableinformationfromthe“nosense”andboringdata.ThetechnologyofWebdataminingisamethodtosolvethisproblem.Thispaperintroducesthestatusofthedevelopmentofinternetandthebackgroundofwebdataminingandsystematicallyexpatiatethetechnique,theoryandstrategy,making
7、adeeperdiscussiononthekeytechniqueoftheprocessinwebdatamining,mainlyfocusedonthepreprocessandassociationrulealgorithIIr—Apriori.Fortheaspectofweblogpreprocessing,designthedatabasetableandrealizetheprocessofthealgorithmbycomparingallkindsofmethodsexisted.For
8、theassociationrule,thispaperanalyzestheclassicalcharacterofApriorialgorithm,findingoutthedisadvantageofthealgorithmandraisetheimprovementplan.Atlast,puttheimprovedalgorithminuseofanalyzingtheWeblogandgetabetterresult.KeyWords:WebMining,AssociationRule,DataP
9、reprocessing,ApriorilI研究生学位论文独创性声明和版权使用授权书独创性声明本人声明:所呈交的论文是本人在陈基漓导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含他人已经发表或撰写过的研究成果,也不包含为获得其它教育机构的学位或证书而使用过的材料。对论文的完成提供过帮助的有关人员已在论文中作了明确的说明并表示谢意。学位论文作者(签字
此文档下载收益归作者所有