web使用挖掘方法的研究与改进

web使用挖掘方法的研究与改进

ID:33289675

大小:5.98 MB

页数:93页

时间:2019-02-23

web使用挖掘方法的研究与改进_第1页
web使用挖掘方法的研究与改进_第2页
web使用挖掘方法的研究与改进_第3页
web使用挖掘方法的研究与改进_第4页
web使用挖掘方法的研究与改进_第5页
资源描述:

《web使用挖掘方法的研究与改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、苏州大学硕士学位论文Web使用挖掘方法的研究与改进姓名:黄金晶申请学位级别:硕士专业:计算机应用技术指导教师:杨季文20090501Web使用挖掘方法的研究与改进摘要摘要随着数据挖掘技术的发展,人们尝试将该技术运用于Web,形成了Web挖掘技术,Web使用挖掘就是其中一个重要的分支。Web使用挖掘通过对Web日志的分析,获取Web上隐藏的用户感兴趣的信息,为用户提供个性化服务、信息导航,并对网站结构的改进与优化提供依据。Web使用挖掘分为数据采集、数据预处理、模式发现与模式分析四个阶段,其中数据预处理和模式发现是本文研究的重点。首先,数据预处理是Web使用挖掘的一个难点。它分为数据清

2、洗、会话识别、路径补充、事务识别四个阶段。本文在会话识别阶段,提出了基于DFA方式的会话识别。在路径补充阶段,提出了一种基于多窗口方式的路径补充。并在此基础上,构造了可用于动态框架网站会话识别的SRDFA。在事务识别阶段,本文改进了事务识别方法中的最大向前路径法,在事务识别阶段记录可能需要添加的超链接。其次,模式发现也是一个重要的阶段。在这个阶段中,本文给出了一种改进的Apriori算法(RSApriori算法)。它通过自上而下的方式从最大频繁项集开始挖掘,直到挖掘出用户需要的频繁项集后终止。此外,本文设计了两个验证性实验,证明了整个处理框架的可行性。最后,本文将整个处理方法运用于一

3、个真实的MVC模式下的struts框架网站,在实践中证明了此方法的有效性和实用性。本文对Web使用挖掘部分算法的改进具有一定的现实意义。首先,它对会话识别和事务分割方法的研究以及部分数据挖掘算法的改进具有一定的参考价值,在一定程度上推动了Web使用挖掘算法的研究;其次,它也促进了Web访问行为分析、网站结构分析和网站结构优化等方面的研究。关键字:W-eb使用挖掘、会话识别、路径补充、关联规则、Apriori算法作者:黄金晶导师:杨季文AbstractResearchandImprovementonWebUsageMiningResearchandImprovementonWebUsa

4、geMiningResearchersapplydataminingtechnologiestOresearchsonwebtechnologiessincedataminingtechnologiesarerapidlydeveloped.Itresultsinanewresearchareacalledwebmining.Webusagemining,whichretrieveshiddenandinterestingimformationbyanlaysingwebserverlog,isoneoftheimportantbranchesofwebmining.Itprovid

5、esindividuationandnavigationofwebsystemstousers.Moreover;itisthefoundationofreconstructingwebsites.Webusageminingisdividedintofourphases,datacollection,datapreprocessing,establishinterestingmodelandpaRemanalysis,andtwoofthem,datapreprocessingandestablishinterestingmodel,arewhatthispaperfocuseso

6、n.Firstly,inwebusageminig,onedifficultyisdatapreprocessing,whichisdividedintodatacleaning,sessionreconstruction,pathsupplementandtransactionreconstruction.Inthestepofsessionreconstruction,thispaperproposessessionreconstructionbasedonDFA,andinthepathsupplementstep,proposesapathsupplementmethodba

7、sedonmulti·window.Besides,thepaperproposesSRDFA,whichreconstructssessionsaimingatdynamicframeworkwebsites.Inthetransactionreconstructionstep,thispaperimprovesthemaximalpathforwardmethod,whichrecordsthehyperlinkthatneedbeappended.S

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。