基于图的半监督中文句子主客观分类算法研究

基于图的半监督中文句子主客观分类算法研究

论文摘要

随着信息技术的飞速发展,网络上存在大量的信息,人们很难在快速、准确地获取信息。由于有使用方便和价格便宜的优势,网购越来越得到人们的认可。在网购行为中,消费者不能亲手检验商品,只能通过其他用户对商品的评价来评判商品的优劣,并以此为重要依据来决定是否购买。为了在海量的文本中找出商品的评价,观点句抽取的需求应运而生。观点句提取旨在区分主观评论句和客观描述句,这样可以方便用户搜索到评价信息,也方便产商进行市场调查。主客观句子分类涉及到自然语言处理、信息抽取、机器学习等多个领域的研究内容。在机器学习领域,有监督学习和无监督学习是两种常用的办法,但是他们在面对实际问题中的标注数据少且不易获取而未标记数据大量存在的情况其分类效果往往不佳。针对这个情况,本文选择使用基于图的直推式半监督学习结合主动学习来解决这个问题。本文首先对半监督学习方法进行分析,并回顾了几种经典的半监督学习算法。然后围绕着当前半监督算法中最活跃的研究领域基于图的半监督方法展开研究,也探索了基于图的算法的相关问题。为了提高分类器性能,本文提出并实现了与主动学习相结合的基于图的半监督算法。最后设计了中文句子主客观分类系统,实现了其基本功能。综合以上,本文对基于图的直推式半监督分类器为核心的中文句子主客观分类系统进行了研究。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 研究意义
  • 1.3 国内外研究现状
  • 1.4 本文主要研究内容
  • 1.5 论文的组织结构
  • 第二章 半监督学习方法研究
  • 2.1 半监督算法基础研究
  • 2.1.1 半监督学习算法介绍
  • 2.1.2 半监督学习中的基本假设
  • 2.2 基于图的半监督学习方法研究
  • 2.3 几个重要的基于图的半监督算法
  • 2.3.1 最小分割法
  • 2.3.2 基于高斯场和调和函数的算法
  • 2.3.3 局部和全局一致算法
  • 2.3.4 流形正则化算法
  • 2.4 图的构造等相关问题
  • 2.4.1 图的构造
  • 2.4.2 图核的转换
  • 2.4.3 不相似性
  • 2.5 实验结果与分析
  • 2.6 本章小结
  • 第三章 与主动学习相结合的半监督算法
  • 3.1 主动学习概述
  • 3.2 主动学习的样本选择策略研究
  • 3.2.1 基于不确定度方法
  • 3.2.2 基于误差最小的方法
  • 3.2.3 基于版本空间缩减的方法
  • 3.2.4 预聚类主动学习方法
  • 3.2.5 多视图主动学习方法
  • 3.3 本文用到的样本选择策略
  • 3.3.1 从正类样本和未标样本中估计最有可能的负类样本
  • 3.3.2 主动学习样本选择策略
  • 3.4 实验结果与分析
  • 3.4.1 实验设计与参数设置
  • 3.4.2 结果分析
  • 3.5 本章小结
  • 第四章 中文句子主客观分类系统设计
  • 4.1 系统概述
  • 4.2 语料预处理模块
  • 4.2.1 分词
  • 4.2.2 词性标注
  • 4.2.3 句法结构分析
  • 4.2.4 依存关系分析
  • 4.3 句法结构模块
  • 4.4 依存关系模块
  • 4.5 基于直推的半监督分类器模块
  • 4.6 本章小结
  • 第五章 总结与展望
  • 5.1 本文工作总结
  • 5.2 未来工作展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].西中文作品[J]. 中国书法 2011(09)
    • [2].《国际中文教育学报》征稿启事[J]. 世界汉语教学 2020(02)
    • [3].2019年国际中文教育大会闭幕[J]. 孔子学院 2020(01)
    • [4].基于文化产业振兴背景的高职院校中文教育研究[J]. 科学咨询(教育科研) 2020(04)
    • [5].印度的中文教育:综述与评估[J]. 南亚东南亚研究 2020(05)
    • [6].紡織月刊[J]. 纺织服装周刊 2018(21)
    • [7].紡織月刊[J]. 纺织服装周刊 2017(44)
    • [8].中文塑造了我的人生[J]. 孔子学院 2018(02)
    • [9].中文版音乐剧的价值和意义[J]. 上海艺术评论 2018(05)
    • [10].基于中英文可比较语料的中文零指代消解[J]. 北京大学学报(自然科学版) 2017(02)
    • [11].增强中文自信 助推中华文化复兴——周善甫的中文观述评[J]. 云南师范大学学报(对外汉语教学与研究版) 2017(02)
    • [12].在邕高校泰国留学生阅读中文书籍现状调查研究与分析[J]. 才智 2017(28)
    • [13].西中文作品欣赏[J]. 美与时代(中) 2014(12)
    • [14].论在外语院系中加强中文课教育的意义[J]. 戏剧之家 2015(10)
    • [15].全家都来学中文[J]. 廉政瞭望(上半月) 2015(10)
    • [16].《高校应用数学学报》第三十卷A辑(中文版)总目次[J]. 高校应用数学学报A辑 2015(04)
    • [17].“厦大中文百年”征稿启事[J]. 厦大中文学报 2020(00)
    • [18].香港中文大学宾馆[J]. 金山 2019(08)
    • [19].香港中文大學[J]. 英语画刊(高级版) 2019(25)
    • [20].中文、悟性和悟性享受[J]. 基础教育论坛 2013(20)
    • [21].中文教育之痛[J]. 教师博览 2010(04)
    • [22].该死的中文秘书台[J]. 教师博览 2011(02)
    • [23].探析文化产业振兴与高校中文教育改革[J]. 长江丛刊 2018(02)
    • [24].唐中文作品[J]. 文化月刊 2015(35)
    • [25].好惨的中文课[J]. 课外阅读 2016(05)
    • [26].一不留神,我要读中文系的博士了[J]. 大学生 2016(17)
    • [27].重建中文之美[J]. 百花洲 2016(01)
    • [28].学中文的骄傲[J]. 快乐作文 2015(Z3)
    • [29].孙中山(银奖)[J]. 上海集邮 2015(S1)
    • [30].我和中文做朋友[J]. 快乐作文 2014(Z5)

    标签:;  ;  ;  ;  

    基于图的半监督中文句子主客观分类算法研究
    下载Doc文档

    猜你喜欢