基于最大熵模型的汉语框架语义角色自动标注

基于最大熵模型的汉语框架语义角色自动标注

论文摘要

本文基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用最大熵模型,对语义角色的各个关键步骤进行了比较深入的研究,将语义角色标注任务定义为:给定句子中的目标词及其所属框架,自动标出相应的框架语义角色。模型以词为基本标注单元,分别使用了基于词层面和基本块层面的特征。针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,基于统计学中的正交表,给出了一种较优模板选择方法。本文的全部实验是在CFN中选出的25个框架的6692条例句上进行的,对每一个框架,将例句均匀分成4份,两两组合进行训练和测试,分3组做2-fold交叉验证。本文将标注步骤分为:1)边界识别2)角色分类3)后处理三个步骤。分别采用了边界识别与角色分类一起进行,以及先边界识别,再角色分类两种标注策略。在后处理步骤上,对输出的标注序列要求在整个句子上满足IOB序列合法性约束。我们采用信息检索中传统的评价指标计算各个步骤的P、R、F1-值,后续实验中我们还给出了2-fold交叉验证的F1-值的平均值,作为性能评价指标。实验结果表明,基于词特征的语义角色自动标注系统的F1-值为56.291%;融入基本块特征后的自动标注系统的F1-值为58.011%。统计检验表明,后者比前者显著好;另外,本文与基于句法分析树的的方法进行对比研究,其结果显著低于本文的方法。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第1章 引言
  • 1.1 课题研究背景和意义
  • 1.2 研究现状
  • 1.2.1 国际评测
  • 1.2.2 研究现状
  • 1.3 研究内容
  • 第2章 汉语框架网络介绍
  • 2.1 汉语框架网络知识库简介
  • 2.2 汉语框架网络标注
  • 第3章 最大熵模型介绍
  • 3.1 最大熵模型简介
  • 3.2 最大熵模型中高斯平滑参数
  • 第4章 基于词的汉语框架语义角色标注模型
  • 4.1 系统描述
  • 4.1.1 数据资源
  • 4.1.2 标注单元
  • 4.1.3 标注步骤
  • 4.2 特征描述
  • 4.2.1 基于词层面的特征
  • 4.2.2 基于正交表的特征模板的选优
  • 4.3 后处理策略
  • 4.4 模型评价
  • 4.5 实验方案
  • 4.6 基于词层面特征不含通用语义角色的实验
  • 4.6.1 基于词层面的不含通用语义角色的边界识别结果
  • 4.6.2 基于词层面的不含通用语义角色的分类结果
  • 4.7 基于词层面含有通用语义角色的实验
  • 4.7.1 含有通用语义角色的边界识别结果分析
  • 4.7.2 含有通用语义角色的角色分类结果分析
  • 第5章 融合汉语基本块信息的语义角色标注模型
  • 5.1 基于基本块的特征
  • 5.2 特征选择
  • 5.3 交叉验证方差计算
  • 5.4 实验结果分析
  • 第6章 总结及展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 附录A:山大973词性标注体系及其与清华大学词性映射关系
  • 附录B:实验用正交表及PB表
  • 攻读学位期间取得的研究成果
  • 致谢
  • 个人简况及联系方式
  • 相关论文文献

    • [1].论元角色的藏语语义角色标注研究[J]. 高原科学研究 2018(03)
    • [2].基于规则的“把”字句语义角色标注[J]. 中文信息学报 2017(01)
    • [3].蒙古文语义角色研究概述[J]. 内蒙古师范大学学报(哲学社会科学版) 2014(06)
    • [4].中文语义角色标注研究概述[J]. 文教资料 2012(27)
    • [5].格语法视域下的汉语语序与语义角色关系探究[J]. 北京化工大学学报(社会科学版) 2018(04)
    • [6].《语义角色研究进展》述介[J]. 当代语言学 2019(04)
    • [7].一种规则与统计相结合的应用题句子语义角色识别方法[J]. 计算机应用研究 2018(08)
    • [8].语义角色理论述评[J]. 河南理工大学学报(社会科学版) 2018(04)
    • [9].基于语义角色标注的专利主题提取研究[J]. 图书情报工作 2014(19)
    • [10].基于分层输出神经网络的汉语语义角色标注[J]. 中文信息学报 2014(06)
    • [11].语义角色标注及其在科技情报分析中的应用研究[J]. 情报理论与实践 2015(01)
    • [12].基于依存特征的汉语框架语义角色自动标注[J]. 中文信息学报 2013(02)
    • [13].基于文献计量的国内语义角色标注研究现状分析[J]. 情报杂志 2012(04)
    • [14].基于特征组合的中文语义角色标注[J]. 软件学报 2011(02)
    • [15].基于语义角色标注的新闻领域复述句识别方法[J]. 中文信息学报 2010(05)
    • [16].中文问答系统中语义角色标注的研究与实现[J]. 科学技术与工程 2008(10)
    • [17].基于外部记忆单元和语义角色知识的文本复述判别模型[J]. 中文信息学报 2017(06)
    • [18].基于语义角色标注的文本水印算法[J]. 计算机应用研究 2017(04)
    • [19].小句补语句小句主语语义角色探析[J]. 山西青年 2018(17)
    • [20].小句补语句小句主语语义角色探析[J]. 文存阅刊 2018(17)
    • [21].基于多策略的藏语语义角色标注研究[J]. 中文信息学报 2014(05)
    • [22].基于语义角色的中文事件识别[J]. 计算机工程与科学 2013(04)
    • [23].基于图模型的语义角色标注重排序[J]. 中文信息学报 2013(05)
    • [24].通用语义角色自动标注研究[J]. 长春工业大学学报(自然科学版) 2012(02)
    • [25].基于语义角色标注的问答系统的研究与实现[J]. 计算机与数字工程 2012(07)
    • [26].语义角色标注研究综述[J]. 山东理工大学学报(自然科学版) 2011(06)
    • [27].汉语框架语义角色的自动标注[J]. 软件学报 2010(04)
    • [28].把字句主语的语义角色[J]. 贵阳学院学报(社会科学版) 2010(02)
    • [29].语义角色标注中特征优化组合研究[J]. 计算机应用与软件 2009(05)
    • [30].基于深度神经网络的语义角色标注[J]. 中文信息学报 2018(02)

    标签:;  ;  ;  ;  

    基于最大熵模型的汉语框架语义角色自动标注
    下载Doc文档

    猜你喜欢