协调过滤推荐的算法框架

协调过滤推荐的算法框架

ID:38348813

大小:151.75 KB

页数:8页

时间:2019-06-10

协调过滤推荐的算法框架_第1页
协调过滤推荐的算法框架_第2页
协调过滤推荐的算法框架_第3页
协调过滤推荐的算法框架_第4页
协调过滤推荐的算法框架_第5页
资源描述:

《协调过滤推荐的算法框架》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Analgorithmicframeworkforperformingcollaborativefiltering摘要:自动的协同过滤技术迅速成为减少信息过载的流行工具,经常用于基于内容的信息过滤系统。我们通过本文献来展示协同过滤应用的算法框架,以及能增加协同预测算法准确率的新的算法元素,并给出了选择正确的协同过滤算法组件的建议。1、介绍自动的协同过滤技术迅速成为减少信息过载的流行工具,经常用于基于内容的信息过滤系统。自动的协同过滤技术在因特网领域取得了很多成功,比如在亚马逊网站、CDNow网站以及MovieFinder网站。基

2、于内容的和协同的过滤使用不同类型的数据来得到一个过滤决策。内容过滤工具通过对文件中包含的信息与用户感兴趣的内容信息进行比较,选择正确的信息给正确的人。内容过滤在使用向量空间查询、智能代理和信息可视化等技术的涉及话题的文本文件查找方面非常有效率。自动化的协同过滤系统的运行是通过收集人对某一领域内项目的判断(比如评分),并与分享了相同信息需求或相同兴趣的人进行匹配。协同过滤系统的用户分享他们对每个项目的分析判断和意见,使得系统中的其他用户能够更好的决定选择哪个项目。同时,协同过滤系统为每个有趣的项目提供个性化的推荐。在信息过滤中,相

3、比基于内容的过滤,协同过滤提供了三个关键的额外优点:(1)支持对项目的过滤(项目的内容不方便通过自动处理过程进行分析);(2)对项目进行过滤的功能是基于质量和兴趣的;(3)提供偶然性推荐的能力。首先,在协同过滤中,人们决定信息流中项目的相关性、质量和兴趣。其结果就是,过滤技术能用于分析类似于电影、想法、感觉、人和政治等计算机难以分析的事物。其次,协同过滤系统能强化信息过滤系统,通过在维度而不仅仅是简单的从内容角度来衡量一个项目有多符合用户的需求和兴趣的方法,人们可以从质量或兴趣的维度来分析,这对于电脑是很难处理的。基于内容的搜索

4、可以得到美联社关于MinnesotaGovernorJesseVentura的所有文章,但是结合协同过滤,可以得到相关文章中所有写得好的。最后,协同过滤系统有时可用于偶然性推荐,即推荐项目包含的内容可能并不符合用户预期的,但却对用户有价值(事先不知道有这个项目,但推荐系统给出推荐后,发现也是自己喜欢的)。我们发现,偶然性推荐频繁使用于电影领域,通过协同过滤系统精确推荐用户可能从没有想过的电影。协同过滤用于强化信息过滤工具的潜力是巨大的,但是为了达到最大的潜力,它必须结合现有的基于内容的信息过滤技术。协调过滤本身能很好的预测满足用

5、户兴趣或口味的项目,但不能很好的适用于对具体信息内容需求的定位。在本文献中,我们提出了一个应用协调过滤的算法框架,并验证了已有的算法变量在该框架下是如何表现的,并提出一个对已有预测算法的新的有效改善,最后通过一组对预测算法变量选择的建议作为总结。2、问题域自动化的协同过滤存在的问题是,给定一系列用户决策的历史参考,如何预测用户对他未评分的项目的喜欢程度。参考的决策行为可以是用户的可见的观点记录,或者是对用户行为中的有价值数据的隐式计量。可见的计量通常是一个简单的对每个项目的数字评分,高分值代表很强的兴趣,低分值代表很不感兴趣。当

6、用户看到一个预测的项目时,通常需要他们对该项目进行评分。隐式的评分通常来源于类似于消费记录或weblogs等数据源,因此leveraging数据已经收集,并用于其他目的。其他隐式表现的数据来源还有阅读使用的时间、在Usenetposting上的URL链接。对使用隐式评分的自动化协同过滤所做的研究还比较少,尽管有一种方法已经在考虑用于支持隐式评分,即将阅读时间等隐式行为与显性评分范围进行映射,然后使用已有的协同过滤算法。从本文献的目的出发,我们将考虑用户评分数据,从1到5分布。预测引擎收集所有的评分,并使用协同过滤技术提供预测。一

7、个活跃用户提供一组项目给预测引擎,而预测引擎返回对这些项目的预测评分。大多数预测引擎也提供一个推荐模型,返回一个前N个最高评分的项目给当前用户。为了提供一个动态的用户界面,预测引擎存在性能约束。潜在的预测请求必须少于1秒,而且预测引擎必须能频繁支持每秒钟几百次预测请求。问题域可以通过由用户和项目组成的矩阵来构造,每个矩阵元素代表一个用户对某个项目的评分。因此,问题在于预测某个空元素的值。在协同过滤中,矩阵通常是稀疏的,因为每个用户仅会对少数项目进行评分。协同过滤中最常用的算法是“基于邻居的算法”。在这个算法中,通过与当前用户相似

8、性比较,选出合适的用户子集,然后使用他们的评分权重合计,产生对当前用户的推荐。其他使用过的算法有贝叶斯网络、神经网络分类和规则学习。本文中我们将探讨基于邻居的协同过滤方法,并描述一些我们新发展的更好的表现算法。基于邻居的算法可以分为三个步骤:(1)基于与当前用户

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。