基于用法属性的现代汉语介词短语边界识别研究

基于用法属性的现代汉语介词短语边界识别研究

论文摘要

由于介词属于虚词,本身并不像实词那样具有具体的词汇意义,但是介词与其介引对象所构成的介词短语在句法分析中却具有重要意义,介词短语结构在汉语文本中是最常见的短语结构,因此对介词短语结构的自动识别是面向自然语言处理的重要内容之一,本文尝试在介词知识库研究成果的基础上,用基于规则和统计两种方法对介词短语边界进行自动识别,从实验结果来看,统计方法的结果平均比规则方法的结果要高23%,不同的统计模型,对于介词短语边界的识别效果是不同,其中ME模型最好,CRF次之,SVM实验结果最差,此外,在加入介词用法属性特征后,三种统计模型在总体识别准确率上比仅基于后界和后词为特征的识别总体准确率都有所提高,ME提高了0.14%,CRY’提高了0.01%,SVM提高了0.22%。实验结果表明介词用法特征从总体上是有助于介词短语边界识别的,这也说明本文基于介词用法属性进行介词短语边界识别的研究策略是有效的。本文所做的主要工作包括:(1)按照俞士汶等人提出的建立现代汉语“三位一体”的广义虚词知识库的构建思想,在彭爽、咎红英等人初步构建的介词知识库框架内容的基础上,完善了介词知识库。(2)将在构建介词知识库中的形成的介词用法规则库转换成介词短语边界识别的静态规则,利用静态规则对介词用法语料库进行基于规则的介词短语边界自动识别实验。(3)对于介词用法语料库中的介词用法进行校对,并标出所有正确的介词短语结构,得到含有介词用法属性和准确介词短语边界标记的实验语料。尝试在实验语料中利用统计模型考察介词用法属性对介词短语边界识别的效果,验证介词用法属性特征对于介词边界识别是否具有有效性。最后,对论文的研究工作进行了总结与展望,指出构建介词知识库是有利于介词短语边界识别的,并根据本文的研究结果明确了下一步研究的内容。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 图表目录
  • 1 引言
  • 1.1 介词及介词短语
  • 1.2 研究背景及意义
  • 1.2.1 研究背景
  • 1.2.2 研究内容
  • 1.2.3 研究意义
  • 1.3 论文组织安排
  • 2 介词短语边界自动识别相关研究
  • 2.1 国外相关研究
  • 2.2 国内相关研究
  • 2.3 本文的主要工作
  • 3 面向NLP的现代汉语介词用法知识库
  • 3.1 介词用法知识库简介
  • 3.2 介词用法属性词典
  • 3.3 介词用法规则库
  • 3.4 介词用法语料库
  • 3.4.1 基于规则的介词用法自动标注
  • 3.4.2 人工校对自动标注结果
  • 3.5 基于规则的介词短语边界识别
  • 3.6 本章小结
  • 4 介词短语边界识别统计模型
  • 4.1 统计语言模型概述
  • 4.2 最大熵模型
  • 4.3 条件随机场模型
  • 4.4 支持向量机模型
  • 4.5 本章小结
  • 5 基于用法属性的介词短语边界识别实验
  • 5.1 实验语料及算法描述
  • 5.1.1 实验语料
  • 5.1.2 算法描述
  • 5.2 特征选择
  • 5.2.1 ME特征表示
  • 5.2.2 CRF特征表示
  • 5.2.3 SVM特征表示
  • 5.3 实验结果及分析
  • 5.3.1 实验评价指标
  • 5.3.2 实验结果
  • 5.4 本章小结
  • 6 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 附录
  • 附录A 介词虚词词典的全部属性
  • 个人简历 在学期间发表的学术论文及研究成果
  • 个人简历
  • 在学期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].基于磁力梯度全张量特征值的均衡边界识别方法[J]. 石油地球物理勘探 2020(02)
    • [2].边界识别技术在内蒙金巴山铜矿区断裂划分中的应用[J]. 物探化探计算技术 2020(02)
    • [3].严重精神障碍社区康复外展服务攻略(十) 场景服务的边界识别与技巧[J]. 中国社会工作 2020(21)
    • [4].重磁(梯度)张量数据边界识别方法研究[J]. 物探化探计算技术 2017(06)
    • [5].小波结合幂次变换方法在边界识别中的应用[J]. 吉林大学学报(地球科学版) 2018(02)
    • [6].图像处理在城乡河网河道边界识别中的应用[J]. 数码世界 2017(08)
    • [7].重磁资料异常分离与构造边界识别方法的应用分析[J]. 中小企业管理与科技(下旬刊) 2016(02)
    • [8].维吾尔语句子边界识别算法的设计与实现[J]. 新疆大学学报(自然科学版) 2008(03)
    • [9].基于水平方向解析信号的均衡重力位场边界识别方法[J]. 地球物理学报 2019(10)
    • [10].基于机器视觉的道路边界识别算法研究[J]. 广东技术师范大学学报 2020(03)
    • [11].重磁异常源边界识别新方法对比及应用研究[J]. 地球物理学进展 2017(06)
    • [12].以规则为主的英语句子边界识别方法的C#实现[J]. 科技信息 2014(14)
    • [13].磁张量数据的边界识别和解释方法[J]. 石油地球物理勘探 2012(05)
    • [14].基于边界识别与组合的裁判文书证据抽取方法研究[J]. 中文信息学报 2020(03)
    • [15].改进的磁源体边界识别方法[J]. 装甲兵工程学院学报 2017(05)
    • [16].基于3D激光雷达点云的道路边界识别算法[J]. 广西大学学报(自然科学版) 2017(03)
    • [17].现代藏语助动词结尾句子边界识别方法[J]. 中文信息学报 2013(01)
    • [18].基于邻域扩展量化法的城市边界识别[J]. 地理科学进展 2015(10)
    • [19].基于统计的介词短语边界识别研究[J]. 河南大学学报(自然科学版) 2011(06)
    • [20].空间归一化边界识别方法用于判断地质体的水平位置及深度(英文)[J]. Applied Geophysics 2014(02)
    • [21].移动机器人的边界识别和遍历矫正[J]. 微型机与应用 2014(03)
    • [22].统计与规则相结合的维吾尔语句子边界识别[J]. 计算机工程与应用 2010(14)
    • [23].基于重力梯度结构张量特征值斜导数边界识别方法及其在南海的应用[J]. 地球物理学报 2018(06)
    • [24].最大熵和规则相结合的藏文句子边界识别方法[J]. 中文信息学报 2011(04)
    • [25].基于空间句法理论的城市群核心区发展边界识别[J]. 地理研究 2020(06)
    • [26].藏语句子边界识别方法[J]. 西藏大学学报(自然科学版) 2012(02)
    • [27].基于模型的圆形边界识别方法[J]. 北京理工大学学报 2008(09)
    • [28].UBII:一种协同经济、社会与人类活动的城市边界识别指数[J]. 测绘与空间地理信息 2019(02)
    • [29].边界识别技术及其在虎林盆地中的应用[J]. 吉林大学学报(地球科学版) 2012(S3)
    • [30].方向总水平导数法的改进和边界识别中的应用[J]. 东北大学学报(自然科学版) 2019(01)

    标签:;  ;  ;  ;  ;  

    基于用法属性的现代汉语介词短语边界识别研究
    下载Doc文档

    猜你喜欢