基于条件随机场的中文命名实体识别

基于条件随机场的中文命名实体识别

论文摘要

命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。因此,对命名实体识别的研究具有很大的实用意义。本文针对现代汉语文本的特点,主要研究以人名、地名和组织名的识别为核心内容的中文命名实体识别问题,我们以一种较新型的统计模型--条件随机场为基本框架,设计并实现了一个中文命名实体识别系统。具体说来,本文的主要内容如下:本文首先分析了命名实体识别的难点,人名、地名、组织名的相关语言学知识,并对现有的一些命名实体识别方法和中文命名实体识别系统进行了简要介绍。接着,详细介绍了条件随机场的定义、模型结构、势函数、参数估计和训练方法、概率计算方法等。进一步地,将条件随机场模型应用于中文命名实体识别任务,提出了适合于各类中文命名实体的特征模板,并通过实验进行验证,确定了有效特征。本文最后,实现了一个基于条件随机场的中文命名实体识别系统,系统采用了层叠结构,以模型训练模块和命名实体识别模块作为系统的核心组成部分,在低层条件随机场模型中进行人名、简单地名以及简单组织名的识别,低层的识别结果传递到高层模型,再进行复合地名与复合组织名的识别。实验结果表明,基于条件随机场的中文命名实体识别系统能够获得较为满意的效果,在对2004年863中文命名实体识别评测语料的开放测试中,系统识别的精确率、召回率和F值分别为82.50%、76.04%和79.14%。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究背景和意义
  • 1.2 国内外命名实体识别研究现状
  • 1.3 论文的主要工作
  • 1.4 论文结构安排
  • 第二章 命名实体识别综述
  • 2.1 命名实体识别的难点
  • 2.2 各类命名实体的特点
  • 2.2.1 人名
  • 2.2.2 地名
  • 2.2.3 组织名
  • 2.3 命名实体识别的主要方法
  • 2.4 现有的中文命名实体识别系统介绍
  • 2.5 本章小结
  • 第三章 条件随机场
  • 3.1 有向图模型
  • 3.1.1 生成模型的局限性
  • 3.1.2 最大熵马尔可夫模型
  • 3.2 无向图模型
  • 3.3 条件随机场的无向图结构
  • 3.4 最大熵理论
  • 3.5 势函数
  • 3.6 参数估计与训练
  • 3.6.1 最大似然估计
  • 3.6.2 迭代缩放算法
  • 3.7 参数估计的优化
  • 3.7.1 一阶优化技术
  • 3.7.2 二阶优化技术
  • 3.8 条件随机场概率的矩阵计算
  • 3.9 本章小结
  • 第四章 特征集
  • 4.1 训练语料的转换
  • 4.2 特征模板
  • 4.2.1 适用于人名的特征模板
  • 4.2.2 适用于地名的特征模板
  • 4.2.3 适用于组织名的特征模板
  • 4.2.4 其他特征模板
  • 4.3 特征选择
  • 4.4 特征验证实验
  • 4.5 本章小结
  • 第五章 系统实现
  • 5.1 系统结构
  • 5.1.1 模型训练模块
  • 5.1.2 命名实体识别模块
  • 5.2 条件随机场工具的选用
  • 5.3 实验结果及分析
  • 5.3.1 实验语料和评测指标
  • 5.3.2 实验设计
  • 5.3.3 实验结果
  • 5.3.4 结果分析
  • 5.4 本章小结
  • 第六章 结束语
  • 参考文献
  • 研究生期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].融入语言模型和注意力机制的临床电子病历命名实体识别[J]. 计算机科学 2020(03)
    • [2].特定领域的命名实体识别方法的研究[J]. 电脑知识与技术 2020(08)
    • [3].基于迁移表示学习的军事命名实体识别[J]. 指挥信息系统与技术 2020(02)
    • [4].多神经网络协作的军事领域命名实体识别[J]. 清华大学学报(自然科学版) 2020(08)
    • [5].在线中文命名实体识别平台研究[J]. 江苏科技信息 2020(15)
    • [6].基于机器阅读理解的中文命名实体识别方法[J]. 模式识别与人工智能 2020(07)
    • [7].命名实体识别研究综述[J]. 情报学报 2018(03)
    • [8].面向中文微博命名实体识别的对比研究[J]. 湖北民族学院学报(自然科学版) 2017(01)
    • [9].基于词典匹配的蒙古文命名实体识别研究[J]. 中央民族大学学报(哲学社会科学版) 2017(03)
    • [10].中文在线健康社区中的医疗命名实体识别方法研究[J]. 信息系统学报 2017(02)
    • [11].桥梁检测领域命名实体识别[J]. 数字技术与应用 2020(01)
    • [12].基于迁移学习的维吾尔语命名实体识别[J]. 东北师大学报(自然科学版) 2020(02)
    • [13].用于社交媒体的中文命名实体识别[J]. 中文信息学报 2020(08)
    • [14].一种面向时政新闻的命名实体识别方法[J]. 北京信息科技大学学报(自然科学版) 2018(06)
    • [15].命名实体识别方法研究进展[J]. 现代计算机(专业版) 2018(35)
    • [16].基于多注意力的中文命名实体识别[J]. 信息与电脑(理论版) 2019(09)
    • [17].中文命名实体识别模型对比分析[J]. 现代计算机 2019(14)
    • [18].基于注意力机制的命名实体识别模型研究——以军事文本为例[J]. 计算机科学 2019(S1)
    • [19].基于深度学习的军事命名实体识别方法[J]. 装甲兵工程学院学报 2018(04)
    • [20].基于深度学习的医疗命名实体识别[J]. 计算技术与自动化 2017(01)
    • [21].命名实体识别综述[J]. 现代计算机(专业版) 2016(03)
    • [22].基于本体的产品命名实体识别研究[J]. 武汉理工大学学报(信息与管理工程版) 2011(06)
    • [23].藏语命名实体识别研究[J]. 西北民族大学学报(自然科学版) 2010(03)
    • [24].基于条件随机域的生物命名实体识别[J]. 计算机工程 2009(22)
    • [25].基于最大熵模型的中文命名实体识别研究[J]. 科技信息(学术研究) 2008(30)
    • [26].基于准循环神经网络的中文命名实体识别[J]. 计算机工程与设计 2020(07)
    • [27].融合空洞卷积神经网络与层次注意力机制的中文命名实体识别[J]. 中文信息学报 2020(08)
    • [28].反馈式K近邻语义迁移学习的领域命名实体识别[J]. 智能系统学报 2019(04)
    • [29].基于深度学习的作战文书命名实体识别[J]. 指挥控制与仿真 2019(04)
    • [30].基于Attention-BiLSTM的中文命名实体识别[J]. 湖南工业大学学报 2019(05)

    标签:;  ;  ;  

    基于条件随机场的中文命名实体识别
    下载Doc文档

    猜你喜欢