基于场景化知识表示的自然语言处理及其在自动文本校对中的应用

基于场景化知识表示的自然语言处理及其在自动文本校对中的应用

论文题目: 基于场景化知识表示的自然语言处理及其在自动文本校对中的应用

论文类型: 博士论文

论文专业: 交通信息工程及控制

作者: 王燚

导师: 徐扬

关键词: 自然语言处理,场景化知识表示,语言表达总体模型,句法分析算法,语义辅助句法分析,语义文本校对

文献来源: 西南交通大学

发表年度: 2005

论文摘要: 自然语言处理就是用计算机处理自然语言,以理解自然语言中表达的知识和含义,或者将知识用自然语言表达出来。因而综合知识表示的自然语言模型是自然语言处理研究的一个核心问题。然而目前尚缺乏一种从知识的语言表达的角度而设计的自然语言模型。本文从分析人使用语言表达知识的自然过程出发,提出了一种知识语言表达的总体模型,并据此提出了场景化知识表示体系。同时,将该语言模型和知识表示体系应用于基于语义的特殊领域文本校对中,取得了良好的效果。 我们认为,人使用自然语言表达其认知的一个核心步骤是提取认知中的关键信息。这些关键信息同样也是人进行逻辑思考的基础。我们分析了自然语言表达知识时所需要的各类关键信息,并采用场景的形式来组织这些信息,从而形成了场景化知识表示的结构。从知识中提取出关键信息被称为知识的场景化分析。它主要包括三个步骤,即:组成识别、特征识别和场景识别。它们分别提取出知识的组成信息、知识的组成元素的特征信息以及它们在特定场景中的角色信息。 在此基础上,我们研究了基于知识场景结构的形式化推理方法,包括:继承推理、例证推理和否定推理。同时也定义了将场景知识结构转换为一阶谓词逻辑表达式的转换规则,为使用自动推理的方法进行语义判断提供了基础。 以知识的场景化描述为核心,提出了使用语言描述知识的的总体模型。在该模型中,知识的语言描述共包括五种主要的方式:名称描述、指代描述、主类描述、内在结构描述和相关知识描述。其中前三种描述方式统称为词汇化描述,因为它们均直接使用词汇来表达知识。后两种统称为结构化描述。其中,内在结构描述通过对知识的场景化分析,将知识的场景结构通过语言转换模板转换为语言的序列结构。这种描述方式主要产生语言中的句子结构。相关知识描述则使用知识的相关知识对它进行描述。其方式和过程与内在结构描述相同。它主要产生语言中的短语、定语从句、插入语等结构。 在这一模型的基础上,我们还分析了汉语中的各种句型和短语结构,提出了相应的语法场景模板和语言转换模板。通过这些模板,可以实现知识的场景化表示与自然语言之间的双向转换,从而使场景化知识表示成为一种真

论文目录:

第1章 绪论

1.1 概论

1.2 自然语言处理研究现状

1.2.1 自然语言处理研究的目的和应用

1.2.2 自然语言处理研究的层面

1.2.3 自然语言处理研究的几个趋势

1.3 语义研究现状

1.3.1 词汇层面的语义研究

1.3.2 句内层面的语义研究

1.4 自然语言处理中的知识表示

1.5 本文的主要工作

1.6 本文的结构

第2章 场景化知识表示

2.1 概述

2.2 知识的描述过程分析

2.3 语言多样性产生因素分析

2.4 知识的场景化的结果表达:场景化知识表示

2.4.1 关于场景化分析结果表示的设想

2.4.2 组成识别的结果表示

2.4.3 特征识别结果的表达

2.4.4 场景模板与场景识别结果表示

2.4.5 场景化知识表示

2.5 场景化知识表示的推理

2.5.1 继承推理

2.5.2 例证推理

2.5.3 否定推理

2.6 场景知识表示转换为一阶谓词逻辑

2.7 小结

第3章 场景化知识表示与自然语言生成

3.1 语言表达的总体过程分析

3.1.1 表达知识对象的几种主要方式

3.1.2 语言表达的总体过程分析

3.1.3 使用语言转换模板进行转换的方法

3.2 汉语语言转换模板

3.2.1 生成汉语句型的语言转换模板

3.2.2 汉短语结构分析

3.3 词汇化

3.4 小结

第4章 场景化知识表示与自然语言理解

4.1 使用语言转换模板的自然语言语句分析

4.1.1 基于语言转换模板的反向转换

4.1.2 反词汇化

4.2 Chart句法分析算法的优化

4.2.1 Chart句法分析算法简介

4.2.2 基于预测类型的Chart算法

4.2.3 禁入区算法

4.3 短语结构转换为场景知识结构的方法

4.4 语义辅助的句法分析

4.4.1 概述

4.4.2 短语的可理解性

4.4.3 基于场景化知识表示的短语可理解性判断

4.5 小结

第5章 基于自组织映射的自动词汇分类

5.1 概述

5.2 SOM简介

5.3 扩散型自组织映射(DSOM)

5.3.1 新增的基本概念

5.3.2 DSOM的学习算法

5.4 基于SOM的词类簇合

5.4.1 词类SOM映射现有方法简介

5.4.2 基于短语上下文的词类映射

5.5 小结

第6章 基于场景化知识表示的特殊问题校对系统

6.1 系统的目标

6.2 系统的总体流程

6.3 特殊问题判断原理

6.3.1 语义表达问题判断

6.3.2 引号表达问题判断

6.4 文字校对中的拼写错误判断原理

6.4.1 相似字符串搜索

6.4.2 相似字符串编辑距离的动态编程算法

6.5 系统模块

6.6 系统功能

6.7 小结

第7章 总结和展望

7.1 本文的主要贡献

7.2 后续的研究工作

致谢

参考文献

作者在攻读博士学位其间的主要成果

发布时间: 2006-03-06

参考文献

  • [1].基于词联接的自然语言处理技术及其应用研究[D]. 李良炎.重庆大学2004
  • [2].最大熵方法及其在自然语言处理中的应用[D]. 周雅倩.复旦大学2005
  • [3].计算机辅助诗词创作中的风格辨析及联语应对研究[D]. 易勇.重庆大学2005
  • [4].汉语指代消解及相关技术研究[D]. 王智强.北京邮电大学2006
  • [5].汉英双语语料库自动对齐研究[D]. 王斌.中国科学院研究生院(计算技术研究所)1999
  • [6].自然语言处理中词相关性知识无导获取和均衡分类器构建[D]. 鲁松.中国科学院研究生院(计算技术研究所)2001
  • [7].基于自然语言处理的空间概念建模研究[D]. 李晗静.哈尔滨工业大学2007
  • [8].基于分布表示的跨语言跨任务自然语言分析[D]. 郭江.哈尔滨工业大学2017
  • [9].高适应性基于实例的机器翻译中关键技术研究[D]. 任飞亮.东北大学2008
  • [10].基于深度学习的文本向量化研究与应用[D]. 于政.华东师范大学2016

相关论文

  • [1].面向搜索引擎的自然语言处理关键技术研究[D]. 李莎莎.国防科学技术大学2011
  • [2].自然语言处理中序列标注模型的研究[D]. 计峰.复旦大学2012
  • [3].汉语语义知识的表示及其在汉英机译中的应用[D]. 齐璇.国防科学技术大学2002
  • [4].关于计算机理解自然查询语言的研究[D]. 郑逢斌.西南交通大学2004
  • [5].中文数据库自然语言查询处理研究[D]. 孟小峰.中国科学院研究生院(计算技术研究所)1999
  • [6].基于概念的若干知识表示模型及相关方法研究[D]. 周文.上海大学2007

标签:;  ;  ;  ;  ;  ;  

基于场景化知识表示的自然语言处理及其在自动文本校对中的应用
下载Doc文档

猜你喜欢