面向网络的用户观点评价报告的自动生成研究

面向网络的用户观点评价报告的自动生成研究

论文摘要

随着电子商务越来越受欢迎,网络上的产品评论数量获得快速增长。对于一个流行的产品,评论数量可以达到成千上万条。这使得一个潜在客户很难通过阅读这些评论来制定他们的购买策略。也使得产品的生产企业很难对客户意见进行跟踪和管理。本文将对网络上的用户评论进行挖掘并且生成情感报告。我们只关注用户表达了情感的产品属性,因此本文提到的情感报告不同于传统的自然语言中的文本摘要。为了进行属性的自动抽取和用户观点的挖掘,本文构建了用于产品属性抽取及其用户观点挖掘的资源库,主要包括程度修饰词资源,否定词资源、第一人称代词资源,语气助词资源,感觉词资源,结构词资源和情感词资源。这些资源都是通用的资源,而不是针对具体领域构建的资源,其中在情感词的构建中,提出了基于模板打分的属性摇摆词词对资源构建,有效解决了极性不确定的情感词对情感分析的影响。近年来,研究者提出了许多产品属性抽取的方法,常见的有基于模板的方法和基于统计的方法。本文分析了这两种方法的不足,提出了基于模板自动生成的产品属性的抽取方法。首先使用名词、名词短语和特殊位置的动词、动名词结构获取候选产品属性;继而结合词频信息和停用词表对候选产品属性进行过滤;然后基于自动生成的模板打分进行筛选;最后,我们还对属性进行了分类,把产品属性分为主从属性和单属性。在这一阶段,我们还尝试了新词的发现及新词中属性的识别。本文根据不同类型观点句的特征,采用不同的意见挖掘技术进行属性情感分析。对于普通的评论句,我们根据属性词和情感词的不同而采用不同的策略进行情感倾向性判定。情感分析主要有两种方法:基于情感词标注的情感分析和基于机器学习方法的情感分析,由于基于机器学习的方法需要大量的标注语料,并且领域可移植性比较差,结合基于情感词标注的情感分析,本文提出了基于属性情感词词对的情感分析方法,并提出了基于情感句模板的无情感词评论句的情感分析,在处理含有否定词的评论句时,本文提出了否定转移算法。报告生成阶段,本文提出了基于属性层次的情感分析报告,通过对产品属性以及该属性的子属性的情感极性的总结生成最终的情感报告。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.2.1 产品属性提取的研究现状
  • 1.2.2 情感分类的研究现状
  • 1.2.3 主观性分类的研究现状
  • 1.2.4 词的极性分类的研究现状
  • 1.2.5 基于产品属性的情感挖掘和报告生成研究现状
  • 1.3 本课题的提出
  • 1.4 本文组织结构
  • 第2章 相关技术的介绍
  • 2.1 产品属性的抽取
  • 2.1.1 产品属性的定义
  • 2.1.2 产品属性抽取的技术
  • 2.2 情感分析
  • 2.3 词的极性分类方法
  • 2.4 基于产品属性情感报告生成
  • 2.5 模板介绍
  • 2.6 评价方法
  • 2.7 本章小结
  • 第3章 资源构建
  • 3.1 情感词极性修饰词资源构建
  • 3.2 评论中通用资源构建
  • 3.2.1 第一人称代词资源的构建
  • 3.2.2 结构词资源的构建
  • 3.2.3 语气助词资源的构建
  • 3.2.4 感觉词资源的构建
  • 3.3 不可扩展词资源的构建
  • 3.4 疑问词资源
  • 3.5 情感词典构建
  • 3.5.1 基础情感词
  • 3.5.2 摇摆情感词
  • 3.6 隐含属性情感词库构建
  • 3.7 本章总结
  • 第4章 产品评论的情感分析和报告生成
  • 4.1 研究目标
  • 4.2 总体设计
  • 4.3 产品评论语料预处理
  • 4.3.1 中文产品评论语料的特点分析
  • 4.3.2 产品评论语料搜集与预处理
  • 4.4 产品属性自动提取
  • 4.4.1 抽取候选产品属性
  • 4.4.2 过滤候选产品属性
  • 4.4.3 生成优质模板
  • 4.4.4 产品属性选择
  • 4.4.5 抽取新词和固定搭配
  • 4.4.6 判定新词和固定搭配是否是属性
  • 4.4.7 产品属性分类
  • 4.4.8 最终产品属性生成
  • 4.5 产品属性情感倾向性判断
  • 4.5.1 属性情感词词对的抽取
  • 4.5.2 评论句分类
  • 4.5.3 属性的情感倾向性判定
  • 4.5.4 否定词处理
  • 4.5.5 情感词极性强度的计算
  • 4.5.6 普通句中产品属性极性强度的计算
  • 4.6 情感报告生成
  • 4.7 本章总结
  • 第5章 实验及结果分析
  • 5.1 实验数据准备
  • 5.2 产品属性抽取的实验及结果
  • 5.3 产品属性的情感分析实验及结果
  • 5.3.1 摇摆情感词实验及结果分析
  • 5.3.2 属性情感词词对抽取实验及结果分析
  • 5.3.3 否定极性转移实验及结果分析
  • 5.3.4 产品属性情感分析实验及结果分析
  • 5.4 报告生成的实验及结果
  • 5.5 本章总结
  • 第6章 结论
  • 6.1 本文的结论
  • 6.2 未来的研究方向
  • 参考文献
  • 致谢
  • 攻读硕士学位期间参加的科研项目
  • 相关论文文献

    • [1].基于注意力机制的评论情感分析及情感词检测[J]. 计算机科学 2020(01)
    • [2].基于“属性-情感词”汽车本体的文本情感分析[J]. 计算机技术与发展 2020(08)
    • [3].基于分类的微博新情感词抽取方法和特征分析[J]. 计算机学报 2018(07)
    • [4].音乐对情感词加工的情感意义双启动效应[J]. 北方音乐 2014(10)
    • [5].基于语义分析的评价对象-情感词对抽取[J]. 计算机学报 2017(03)
    • [6].情感词信息加工的脑神经认知机制研究[J]. 西北民族大学学报(自然科学版) 2015(03)
    • [7].基于特征选择技术的情感词权重计算[J]. 北京工业大学学报 2016(01)
    • [8].情感词扩展对微博情感分类性能影响的实验分析[J]. 小型微型计算机系统 2016(05)
    • [9].结合情感词网的中文短文本情感分类[J]. 计算机应用研究 2015(10)
    • [10].单词统计特性在情感词自动抽取和商品评论分类中的作用[J]. 计算机应用研究 2019(03)
    • [11].基于句法依赖规则和词性特征的情感词识别研究[J]. 情报理论与实践 2018(05)
    • [12].基于词语相关度的微博新情感词自动识别[J]. 计算机应用 2016(02)
    • [13].网络商品评论的特征–情感词本体构建与情感分析方法研究[J]. 现代图书情报技术 2014(05)
    • [14].基于耦合关系的情感词语义分析方法[J]. 计算机科学与探索 2014(09)
    • [15].音乐对情感词加工的情感/意义双启动效应[J]. 心理科学 2013(03)
    • [16].基于依存关联分析的情感词扩展[J]. 北京邮电大学学报 2012(05)
    • [17].网络情感词自动识别方法研究[J]. 现代图书情报技术 2011(10)
    • [18].基于关联规则挖掘和极性分析的商品评论情感词典构建[J]. 情报学报 2016(05)
    • [19].结合依存关联分析和规则统计分析的情感词库构建方法[J]. 武汉大学学报(理学版) 2013(05)
    • [20].基于翻译和语义方法的情感词挖掘研究[J]. 计算机工程与应用 2011(32)
    • [21].基于句法结构和依存关系的评价对象提取[J]. 计算机应用研究 2020(04)
    • [22].基于领域情感词库的大气质量感知满意度研究[J]. 环境污染与防治 2020(09)
    • [23].基于词间距和点互信息的影评情感词库构建[J]. 阜阳师范学院学报(自然科学版) 2019(02)
    • [24].中小学藏文教材中情感词的分布规律研究[J]. 电脑知识与技术 2016(06)
    • [25].基于情感词属性和云模型的文本情感分类方法[J]. 计算机工程 2013(12)
    • [26].领域情感词典构建方法研究[J]. 图书馆理论与实践 2019(12)
    • [27].基于情感词向量的微博情感分类[J]. 中文信息学报 2017(03)
    • [28].基于上下文的情感词向量混合模型[J]. 计算机科学 2020(S2)
    • [29].中文基础情感词词典构建方法研究[J]. 计算机应用 2009(10)
    • [30].二语情感抽象概念加工的具身认知研究[J]. 宁波大学学报(人文科学版) 2020(06)

    标签:;  ;  ;  ;  ;  

    面向网络的用户观点评价报告的自动生成研究
    下载Doc文档

    猜你喜欢