基于CNN的中文评论情感分类研究

基于CNN的中文评论情感分类研究

ID:37062118

大小:1.49 MB

页数:50页

时间:2019-05-16

基于CNN的中文评论情感分类研究_第1页
基于CNN的中文评论情感分类研究_第2页
基于CNN的中文评论情感分类研究_第3页
基于CNN的中文评论情感分类研究_第4页
基于CNN的中文评论情感分类研究_第5页
资源描述:

《基于CNN的中文评论情感分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10126学号:31609103分类号:TP391编号:论文题目基于CNN的中文评论情感分类研究内蒙古大学学院:计算机学院专业:软件工程研究方向:智能信息处理姓名:刘玉茹指导教师:魏宏喜副教授2018年4月25日内蒙古大学硕士学位论文基于CNN的中文评论情感分类研究摘要情感分类是近年来自然语言处理领域的一个研究热点,也是文本挖掘的一个重要分支,受到了越来越多学者的关注与研究。随着各种社交媒体以及电子商务的发展,人们开始在社交网络上发表自己的观点,这些数据成为了重要的互联网资源。在发布的海

2、量文本中有热点事件的评论,有商品或者服务的评论,有电影或者书籍的评论,这些评论中的大多数都带有明显的情感倾向。如何从海量文本中挖掘出带有情绪和喜恶的主观信息,就是情感分类要做的工作,同时在商业领域也有非常广泛的应用前景。近年来,深度学习的兴起使自然语言处理领域的研究得到了突破,卷积神经网络在文本分类中得到了广泛的应用。随着电子商务的普及,网络上出现了越来越多的商品评论信息,传统的方法多为基于情感词典或者机器学习等,这些方法存在数据稀疏的问题,且不能挖掘词与词之间的深层语义关系,本文提出了卷积神经网

3、络模型来解决中文评论情感分类的问题,并引入了Word2vec词向量,将每条评论转化为词向量表示的矩阵输入卷积神经网络中进行情感分类,提高情感分类的准确率。为了对比所设计卷积神经网络的性能,本文采用了长短期记忆神经网络和支持向量机模型作为基线方法。通过对比实验,卷积神经网络分类性能优于两种基线方法。实验结果表明:卷积神经网络能够提取不同维度的特征且性能稳定,能够更好的挖掘出词向量之间隐藏的情感信息;长短期记忆神经网络虽然I基于CNN的中文评论情感分类研究能够保存长期记忆信息,但是在训练过程中会造成重

4、要信息的丢失,所以其性能不如卷积神经网络好;而支持向量机模型忽略了词与词之间的语序及语义信息,导致其性能较差。关键词:情感分类;Word2vec;深度学习;卷积神经网络;长短期记忆神经网络II内蒙古大学硕士学位论文RESEARCHONCHINESESENTIMENTCLASSIFICATIONBASEDONCNNABSTRACTSentimentclassificationisaresearchhotspotinthefieldofnaturallanguageprocessinginrecent

5、years.Itisalsoanimportantbranchoftextdataminingandhasreceivedmoreandmorescholars'attentionandresearch.Withthedevelopmentofvarioussocialmediaande-commerce,peoplebegantoexpresstheiropinionsonsocialnetworks,andthesedatahavebecomeimportantInternetresource

6、s.Therearecommentsabouthoteventsinthemassivetextspublished,reviewsofgoodsorservices,reviewsofmoviesorbooks,andmostofthesecommentshaveobvioussentimenttendencies.Howtoexcavatethesubjectiveinformationwithemotionsandlikesanddislikesfromavastamountoftextis

7、theworkofemotionclassification.Sentimentclassificationiswidelyappliedinproductanalysisandrecommendations.Inrecentyears,theriseofdeeplearninghasmadeabreakthroughinthefieldofnaturallanguageprocessing,andtheconvolutionneuralnetworkhasbeenwidelyusedintext

8、classification.Withthepopularityofe-commerce,moreandmoreappearedonthenetworkinformationcommentsgoods,morethanthetraditionalmethodsfordictionarybasedonemotion,ormachinelearning,etc.,theseproblemsIII基于CNN的中文评论情感分类研究datasparsemethod,andcan'tdigth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。