基于web 挖掘的个性化推荐模型的研究

基于web 挖掘的个性化推荐模型的研究

ID:17824509

大小:181.50 KB

页数:7页

时间:2018-09-06

基于web 挖掘的个性化推荐模型的研究_第1页
基于web 挖掘的个性化推荐模型的研究_第2页
基于web 挖掘的个性化推荐模型的研究_第3页
基于web 挖掘的个性化推荐模型的研究_第4页
基于web 挖掘的个性化推荐模型的研究_第5页
资源描述:

《基于web 挖掘的个性化推荐模型的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于Web挖掘的个性化推荐模型的研究曹雷1杜辉锋21)解放军理工大学指挥自动化学院作战软件教研室南京2100072)解放军理工大学指挥自动化学院研究生2队南京210007摘要:提出了一种新颖的个性化网页推荐模型。它基于挖掘Web日志记录,同时融合了信息检索和信息过滤的相关技术。运用概率分布模型来表达文档和用户兴趣,并且通过聚类生成群体兴趣扩展了个体兴趣。同时阐述了用户兴趣文件建立、维护和个性化推荐。实验证明了推荐模型的准确性和有效性。关键词:个性化推荐;数据挖掘;群体兴趣;聚类ResearchofRecommendationModelinPersonalServiceBasedonWeb-m

2、iningLeiCao1,HuifengDu21)OperationalSoftwareDepartmentICA,PLAuniversityofScienceandTechnology,Nanjing2100072)postgraduateTeam2ICA,PLAuniversityofScienceandTechnology,Nanjing210007Abstract:Anewrecommendationmodelinpersonalservice,whichintegratesinformationretrievalandinformationfilteringtechnologyba

3、sedonminingofWeb-logisproposed.Weapplythemodelofprobabilityfeaturetorepresentuserinterestandfile.Atthesametime,weextendsingleuserprofilebasedongroupinterest,clusteringfromtheallusers’interest.Atlast,thissystemconstitutesandmaintainsusermodeltoimplementpersonalrecommendation.Theexperimentresultindic

4、atesthismodeliseffective.Keywords:RecommendationinPersonalService;Data-mining;GroupInterest;Clustering随着国际互联网的迅速发展,网络信息资源呈爆炸性增长,人们已经被包围在信息的汪洋大海之中,要准确、快速地查找自己所需的信息已变得越来越困难。因而人们迫切渴望有一种将个体用户感兴趣的信息有针对性的主动推荐出来,对不同用户提供不同的服务策略和服务内容的服务模式,即个性化信息服务方式。为了满足用户的个性化需求,许多研究者提出了各种解决方法。信息检索(IR)是最早基于内容的推荐技术,在用户给定的检索命

5、令和条件下查找符合条件的内容。信息过滤(IF)技术使用用户模型来描述用户兴趣,将新的网页与用户模型进行相似度计算,将相似度高的网页推荐给用户。文献[1~3]基于协作过滤的方法提供个性化服务,但需要用户输入额外信息以判断用户的个性化行为。基于类别的个性化服务取决于类别的设定和网页内容的分类。分类的粗糙导致了信息的查全率(Recall)和查准率(Precision)不高,从而很难向用户推荐准确和用户感兴趣的网页。本文提出把信息检索、信息过滤与数据挖掘技术相结合,构造一种有效的模型来实现个性化服务中网页的推荐,满足用户个体信息的需求。1推荐模型结构在图1中,我们提出了基于挖掘用户历史浏览行为(记录

6、在服务器日志中),结合信息检索、信息过滤技术的推荐模型结构,用户兴趣和文档由概率分布模型来表示。当得到个体用户兴趣后,通过聚类建立群体用户兴趣,而个体用户兴趣可以从群体用户兴趣中进行学习和扩展。在用户浏览过程中,我们将对用户访问的行为和浏览的网页进行记录、分析和特征抽取,并且将用户的反馈传递到个体用户兴趣库中,从而进一步补充和完善个体用户兴趣库。同时通过群体聚类反馈到群体用户兴趣库中,再更新群体用户兴趣库。图1个性化信息推荐模型结构2关键技术2.1Web记录数据预处理数据预处理阶段的目标是要将服务器的访问记录LOG文件、站点文件和其他统计信息等信息整理成事物数据库,以供数据挖掘阶段使用,这一

7、阶段的工作对挖掘结果有重要的影响。数据预处理的主要内容有:数据清洗、用户识别、确定用户会话、完善访问路径、用户事物模式识别等[4],数据预处理过程如下图所示。图2数据预处理流程2.2用户兴趣建模用户兴趣建模的方式:①通过用户浏览的网页,对搜索结果的反馈信息建立和更新用户兴趣;②在用户没有明确参与的情况下,通过观察用户的浏览行为建立和更新用户兴趣[5]。本文采取这两种方式相结合来表示用户兴趣和文档。目前,传统的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。