论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>硕士论文>范文阅读
快捷分类: 读者杂志投稿 读者杂志订阅 读者杂志免费阅读 读者投稿 读者期刊 读者杂志怎么订阅 给读者投稿 读者杂志合订本 和读者差不多的杂志 读者合订本和期刊区别 小读者杂志投稿 读者杂志经典珍藏书系

关于读者论文范文 基于在线书评的读者情感分析模型相关论文写作参考文献

分类:硕士论文 原创主题:读者论文 更新时间:2024-03-04

基于在线书评的读者情感分析模型是关于本文可作为读者方面的大学硕士与本科毕业论文读者论文开题报告范文和职称论文论文写作参考文献下载。

摘 要:电子书籍网站的用户评论真实客观地反映了读者对书籍的感受,因此对书评的情感分析研究具有学术及商业价值.该文研究了情感分析在该领域的机器学习模型,以情感字典作为主观内容识别,通过神经网络语言模型对情感字典扩充,运用机器学习方法,设计书评领域情感分析模型,并深入探讨了逻辑回归等分类算法,采用多种评价指标分析不同模型效果.结果表明运用主客观分类之后的模型更适合判断读者情感倾向.

关键词: 在线书评;情感分析;情感词典;模型分析;可视化

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2017)33-0206-03

Abstract:User reviews in e-book website truly reflect reader feeling about e-book,so the research of sentiment analysis of book reviews has academic and commercial value. Discussing on machine learing models for sentiment analysis,using sentiment lexicon as subjective content recognition,through the neural network language model to extend the emotional dictionary, the use of machine learning methods, design evaluation of the field of emotional analysis model.Analysis of the logic regression classification algorithm, the use of a variety of evaluation indicators. analysis of different model results, the results show that the use of subjective and objective classification of the model is more suitable to judge the reader"s emotional tendencies.

Key words:online book review; sentiment analysis; sentiment lexico; model analysis; visualization

随着移动网络的发展和网络文学的兴起,越来越多的读者倾向于使用手机、平板电脑等移动端设备购买、阅读电子书籍,并在网上分享各自的对书籍的评价以及对剧情的讨论.书评不仅是对书籍的价值判断和评论,同时对作者以及后来的读者都有着不可代替的参考性[1].有研究发现近一半的读者在决定阅读之前会查看书籍的相关书评,书评对于读者的阅读决策有着重要的影响[2].如果充分收集这些书评并对其进行综合分析,直观地揭示读者对于某本书籍的褒贬态度或情感倾向,将有助于作者了解作品的不足,从而进行改进.但目前绝大多数书评没有被有效利用,在大量的书评中,读者无法直观得出结论.而且,书评的内容都是碎片化的,篇幅长短不一,需要对其重新进行分类和情感分析才能挖掘其中反馈用户褒贬态度或情感倾向的有用信息.

情感分析 (Sentiment Analysis) 又称评论挖掘或意见挖掘(Opinion Mining),指的是对某些商品评论的文本内容进行分析,发现评论人对这些商品的褒贬态度和意见[3].主要任务包括主题抽取、意见持有者识别、评论范围确定和情感极性分析[4].在线评论的特点对情感分析的研究有着重大的学术价值以及直观而广阔的商业价值,目前在世界各国的计算机领域中,情感分析都成为了科学研究的热点方向[5-7].而词相量(word vector)的提出为情感分析引入了更多的优秀算法[8],常用的算法有逻辑回归(Logistic Regression)、朴素贝叶斯(Naive Bayes)、决策树(Decision Tree)、支持相量机(Support Vector Machine,SVM)、K近邻(k-Nearest Neighbor,KNN)等[9-10].

1 书评情感分析模型

为了准确得到书评的情感分析结果,本文以机器学习方法结合自然语言处理方法对书评进行意见挖掘预处理和情感分析.本文重点在于对用户评论的分析处理从而得到对整本书的情感倾向其构建情感分析模型如图1所示.

主要流程为:

1) 数据抓取,选定网站抓取高质量;

2) 数据预处理,对于抓取的语料总会包含一些脏数据需要清洗;

3) 自然语言处理,对整个语料进行分句,识别主观内容,分词,

4) 词相量训练,基于Hownet扩充情感词典;

5) 对语料进行人工分类,确定标签,用机器学习的方法训练构建模型.

2 书评数据抓取及预处理

本文的书评数据来自于某网络小说网站的用户评论,为获取用户关于某一本具体小说的评论数据,首先要打開这个网站,进入到某本小说,便可以显示关于此小说的评论数据,利用网络信息采集工具抓取评论数据,每一条记录包括用户名、评论内容、回复时间、评分,所有数据最终导入到excel中保存.为了确保抓取的数据对问题的研究有价值,需要对数据进行预处理.数据预处理主要包括:

1) 重复评论内容.这种评论主要是用户为了赚取经验等行为和提高或降低某本书的平均评分,这种数据对真实的正负面评论会造成很严重的影响,需要将其删除只保留一条记录.

总结:此文是一篇读者论文范文,为你的毕业论文写作提供有价值的参考。

参考文献:

1、 读者评论 我们该如何保护隐私?(《财经》2018年第2期“失控的摄像头”)中国在公共和私人领域共装有 1 76 亿个监控摄像头。过去十年,中国是监控摄。

2、 在线教育为什么又火了 最近,北京地铁及公交车站的户外广告位上出现了一组广告:变身好奇宝宝的孩子踊跃地向爸爸妈妈提问—问题上至天文下至地理,古今中外、科学人文无所不包。

3、 70%企业亏损详解风口下的在线教育倒闭潮 2000亿元规模的在线教育市场中,互联网低价策略和高昂获客成本之间的矛盾、规模扩张与教学口碑之间的割裂、互联网的快与教育的慢之间的冲突,是在线教。

4、 读者评论 中国经济没有“硬着陆”风险(《财经》2018年第4期“L型走势将持续更久”)从基本面来看,中国经济在2018年没有“硬着陆”的风险。2018。

5、 最严数据法规立法参和者人们不应持续被在线监控 一项即将在欧盟生效的法律,正前所未有地挑动全球范围内互联网企业们的神经。许多欧洲用户已体验到变化——5月开始,他们的谷歌和雅虎邮箱开始涌入大量。

6、 读者评论 中美贸易紧张关系正在缓解(《财经》2018年第11期“贸易战火燃起 市场波动飙升”)中美贸易战火爆发之后,很多人都忧心忡忡大陆的工业受到重创,。