基于融合特征的虚假评论检测算法

基于融合特征的虚假评论检测算法

ID:35070090

大小:5.54 MB

页数:59页

时间:2019-03-17

基于融合特征的虚假评论检测算法_第1页
基于融合特征的虚假评论检测算法_第2页
基于融合特征的虚假评论检测算法_第3页
基于融合特征的虚假评论检测算法_第4页
基于融合特征的虚假评论检测算法_第5页
资源描述:

《基于融合特征的虚假评论检测算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、单位代巧10475 ̄104753万130756分类号巧巧1.1皆旗乂聲硕壬学位论文基于融合特征的虚假评论检测算法学科、专业:计算机应用技术研究方向:数据挖掘申请学位类别:理学硕±申请人:焦易于指导教师:刘刚教授二〇—六年十二月FAKECOMMENTSBASEDONFU別ONFEATUREDETECTIONALGORITHMADissertationSubmited化theGraduateSchoolofHenanUniversityinPartialFulfillmento

2、ftheReuirementsqfortheDereeofgMasterofScienceByJiaoYiuySupervisor:Prof.LiuGangDecember2016,关于学位论文独创声明和学术诚信承诺本人向河南大学提出硕壬学位申请。本人郑重声明:所呈交的学位论文是本人在导师的指导下独立完成的,对所研究的课题有新的见解。据我所知,除文中特别加k乂说明、标注和致谢的地方外,论文中不包括其他人已经发表或撰写过的研究成果,也不包括其他人为获得任何教育、科研机构的学位或证书而使用过的材料一工。与我同作的同事对

3、本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。在此本人郑重承诺:所呈交的学位论文不存在舞弊作伪行为,文责自负。人学位申请(学位论文作者:)签之麵201年处/曰以I关于学位论文著作权使用授权书本人经河南大学审核批准授予硕壬学位。作为学位论文的作者,本人完全了解并同意河南大学有关保留、使用学位论文的要求,即河南大学有权向国家图书馆、科研信息机构,数据收集机构和本校图书馆等提供学位论文(纸质文■乂供公众检索本和电子文本)^、查阅。本人授权河南大学出于宣扬、展览学校学术发展和进行学术交流等目的,可k乂采取影印、缩印、知描和振贝等复制手

4、段保存、汇编学位论文(纸质文本和电子文本)。(涉及保密内容的学位论文在解密后适用本授权书)学位获得者:(学位论文作者)签違V201年f月I曰^学位论文指导教师签名:201年月曰I^摘要商品评论是用户选购商品的重要参考,在电商购物中发挥着重要作用。由于利益驱使,电商评论中的虚假评论越来越多,对消费者形成误导,造成严重损失。因此检测虚假评论具有重要意义。,随着商品销售量的持续增长虚假评论数量激增,然而当前针对虚假评论的检测方一法存在定的局限性>:基于评论内容特征的检测方法难^1满足不同类型的商品下的虚假评论检测,对于领域知识具有较强依

5、赖性,通用性较差;基于行为分析的检测方法依赖于特定用户的评论行为信息,对虚假评论的识别率较低。针对W上问题,本文提出了检测电商平台虚假评论的系统性方法,包括如下H个方面:一一、提出种虚假评论的目标商品识别方法。由于电商平台上的评论信息横跨多种,数量庞大,导致当前的检测方法准确率下降类型商品。为了有效提高检测效率与准确度,进行针对性的研究分析,需要对包含虚假评论的目标商品进行筛选。通过对大量电商数据研究发现一,单商品的用户评论评分服从特定的统计规律,当商品的评分分布偏离该统计规律时,该商品下所包含的评论信息中存在虚假评论的可能性越高。实验表明,通过本文方

6、法筛选出的目标商品中确实包含较多的虚假评论,说明该方法能够识别出包含虚假评论的目标商品。一二、提出种评论文本相似性度量算法,。传统的文本相似性度量算法准确率较低本文根据评论文本内容结构特征,构建文本树形结构,将相似性度量转化为树形结构的一匹配,。通过对树形结构每层的相似性进行度量然后根据权重融合得到最终的整体相似度,。实验表明本文方法在实际文本数据分析中的准确率比现有方法更高。一种基于融合特征的虚假评论检测算法王、提出。现有的检测方法并没有充分利用,检测准确率不够高,用户历史行为信息。本文通过时序模型挖掘用户的行为的动态特征然后将这些动态特征与静志特征

7、进行融合来发现可疑用户,并此来推断这些用户所发-表评论的可疑概率,,earn。最后根据可疑概率和评论文本静态特征借助PULing学习策略来训练分类器,实现虚假评论检测,。实验表明该方法的检测效果优于现有的方法。-关键词:虚假评论,相似性度量,时序分析,融合特征,PULeamingIAbstractC*ommodiviewiimrfrstblrriesanortantrefee打ceoruseouoodsandays

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。