融合语义和句型信息的中文句法分析方法研究与实现

融合语义和句型信息的中文句法分析方法研究与实现

论文摘要

句法分析是自然语言处理领域一项重要的基础性研究工作。它能够发现自然语言中内在的语法结构,是进行高层信息处理和自然语言理解的基石。其中,基于上下文无关文法(PCFG)的句法分析方法一直是该领域研究的主流。本文在PCFG模型的基础上,提出了一种引入中文语义和句型信息的方法,解决了PCFG模型缺少语义信息及文法之缺少全局约束的问题,改进了中文句法分析器的性能。首先,在句法分析中融入语义信息。尝试在非词汇化句法分析方法中融入语义信息,利用语义信息帮助句法分析进行消歧。加入语义信息后,句法分析器的性能在宾大中文树库(CTB)标划分准集上F值提高了1.37%达到了81.63%1。该方法除了能解决中文里常见的一些歧义外,还能从句法分析的结果中获得带有句法约束的语义信息。其次,在句法分析中融入句型信息。根据句法树和文法之间共现的关系,对句型信息进行建模。利用这种句型信息对句法分析的结果进行约束,纠正了基线系统在清华树库上一些句型标记的错误,F值提高了0.17%达到了86.57%1。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 序言
  • 1.1 研究的问题
  • 1.2 问题难点
  • 1.3 研究历史与现状
  • 1.4 研究意义及应用前景
  • 1.5 本文的研究思路和主要工作
  • 1.6 各章节安排
  • 第二章 统计句法分析系统概述
  • 2.1 文法的建模
  • 2.1.1 乔姆斯基层级体系
  • 2.1.2 人类语言的特点
  • 2.1.3 概率上下文无关文法
  • 2.2 文法概率的获得(训练)
  • 2.2.1 有监督的训练方法
  • 2.2.2 无监督的训练方法
  • 2.3 句法分析(解码)
  • 2.4 句法分析评价标准
  • 2.5 PCFG 基本模型的改进
  • 2.5.1 引入词汇化信息的 PCFG
  • 2.5.2 非词汇化 PCFG 模型
  • 第三章 融合语义信息的中文句法分析
  • 3.1 语义
  • 3.2 句法和语义的关系
  • 3.3 中文语义信息对句法分析的影响
  • 3.4 先前的工作
  • 3.5 本文的思路
  • 3.6 实现方法
  • 3.7 实验
  • 3.7.1 语料
  • 3.7.2 基线系统及评测标准
  • 3.7.3 实验结果及分析
  • 3.8 小结
  • 第四章 融合句型信息的中文句法分析
  • 4.1 句型
  • 4.2 概率潜语义分析模型
  • 4.2.1 潜语义分析方法
  • 4.2.2 PLSA 模型介绍
  • 4.2.3 PLSA 模型训练
  • 4.3 句型信息建模
  • 4.4 句型信息的融合
  • 4.5 实验及分析
  • 4.5.1 语料
  • 4.5.2 基线系统
  • 4.5.3 融入句型信息的句法分析实验
  • 4.6 小结
  • 第五章 工作总结和展望
  • 5.1 工作总结
  • 5.2 未来工作展望
  • 参考文献
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    融合语义和句型信息的中文句法分析方法研究与实现
    下载Doc文档

    猜你喜欢