用户评论分析系统研究论文

用户评论分析系统研究论文

ID:6197737

大小:501.50 KB

页数:45页

时间:2018-01-06

用户评论分析系统研究论文_第1页
用户评论分析系统研究论文_第2页
用户评论分析系统研究论文_第3页
用户评论分析系统研究论文_第4页
用户评论分析系统研究论文_第5页
资源描述:

《用户评论分析系统研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、用户评论分析系统研究毕业论文目录1绪论-1-1.1国外评论分析发展状况-1-1.2国内评论分析发展状况-3-1.3本课题研究的内容和意义-5-1.3.1论文的主要内容-5-1.3.2课题研究的意义-5-1.4本文的组织结构-6-2理论综述-8-2.1文本挖掘技术-8-2.1.1数据预处理技术-9-2.1.2挖掘分析技术-9-2.1.3可视化技术-10-2.2极性词典-10-2.2.1静态极性词典-11-2.2.2动态极性词典-13-2.3语义极性分析与分析的难点-14-2.4本章小结-14-3评论分析原型系统设计-16-3.1总体设计-16-3.1.1文本预处

2、理模块-17-3.1.2文本倾向性分析模块-18-3.1.3统计分析模块-18-3.2极性字典设计-19-3.2.1初始极性词典的构建-19-3.2.2网络极性词典扩充-19-3.2.3领域极性词典修正-19-3.2.4否定词典和强调词典-19-3.3数据库设计-20-3.4系统程序设计-21-3.4.1预处理模块程序设计-21-3.4.2文本倾向性分析模块程序设计-22-3.4.3统计分析模块程序设计-23-3.5GUI设计-24--1-3.5.1数据字典管理-24-3.5.2评论文本管理-25-3.5.3评论文本处理-25-3.5.4系统设置和帮助系统-2

3、6-3.6本章小结-27-4系统实现及其在开心商城的应用-28-4.1关键问题的解决与实现-28-4.1.1系统开发、测试环境搭建-28-4.1.2J2EE数据访问方法-28-4.1.3数据处理函数及其访问接口-30-4.1.4系统核心组件应用-31-4.2系统测试-32-4.2.1测试资料-33-4.2.2评论文本倾向性测试-33-4.3开心商城介绍-34-4.4系统应用及其步骤-34-4.4.1开心商城评论分析系统建立步骤-34-4.4.2评论分析原型系统应用效果-36-4.5本章小结-37-5总结与展望-38-5.1总结-38-5.2展望-39-致谢-4

4、1-参考文献-42--1-2010届信息管理与信息系统专业毕业设计(论文)1绪论最近几年,电子商务迅速发展,网上购物已变得不再陌生,越来越多的人足不出户就能买到自己想要的商品。为了更好地服务网上购物的消费者以及增加消费者的购物经验,许多购物网站联合商家为消费者提供了发表评论的平台,这样,就能够给潜在的购买者提供参考,而且也有利于生产商跟踪客户反馈,从而改善新产品的满意度。对于生产商来说,需要获得对产品全面的反馈信息,只靠人工分析少数的评论远远不够。另外,通过统计和分析商品评论,可以知道用户最关注商品的哪个特性,从而有利于对商品的改善。一个能够收集商品评论,并且

5、能有效归纳评论中的品牌,商品特性,以及评价词语的商品评论总结系统,可以有效地为潜在商品用户和商品制造者提供便利。随着人们对商品评论的重视,商品评论呈指数级增长,并且这些评论出现在各大论坛、电子公告板以及门户网站上。而这些评论从本质上讲是一种文本,对这种评论的分析实际上是对文本的数据挖掘。对于这种半结构或无结构化的数据,用传统方法获取特定内容信息的手段却较弱,导致信息搜寻困难和信息利用率低下。文本表达了大量的、丰富的信息,同时包含了许多未被所有者发现的潜在知识。面对浩瀚的文本资源,传统的文档和文本处理工具已经不能满足用户的需求。于是在人工智能研究领域结合结构化数

6、据库中的数据挖掘技术,提出了一种有效的、可以充分利用这些文本数据的新的信息处理技术——文本挖掘。评论挖掘是目前数据挖掘、文本挖掘、自然语言处理等领域的热点研究课题之一。在几年的时间中,无论在英文领域还是在中文领域,观点评论挖掘技术都取得了很大的进步。1.1国外评论分析发展状况在国外,2002年是评论挖掘开始兴起的一年。在这一年里,首先Peter[1]提出将语义倾向性应用在非监督的评论分类上,并设计了一个简单的算法。该算法目的就是将评论分为两类,推荐(recommended)和不推荐(not-43-2010届信息管理与信息系统专业毕业设计(论文)recommen

7、ded)。一段评论将有包含在该评论中的形容词和副词的语义倾向性决定,也就是说,如果一段评论的平均语义倾向性为正,则可以把该评论划分为推荐一类,反之,划分为不推荐那一类。Peter利用PMI-IR算法[2]计算一个短语或者词语的语义倾向性,主要思想就是分别计算给定的短语与“excellent”词和“poor”词之间的互信息,然后两者之差就是给定短语的语义倾向性值。选取了四个领域的评论:汽车、银行、电影以及旅游地,最终实验的准确率达到了74%。BoPang和LillianLee等人[3]使用机器学习的方法对观点评论分类。文章采用电影评论作为实验语料,使用了三种机器

8、学习的分类方法:朴素贝叶斯,最大熵模型

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。