基于模式知识库的问题回答关键技术研究

基于模式知识库的问题回答关键技术研究

论文题目: 基于模式知识库的问题回答关键技术研究

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 杜永萍

导师: 吴立德

关键词: 问题回答,阅读理解,模式匹配,机器学习,自然语言处理,中图分类号

文献来源: 复旦大学

发表年度: 2005

论文摘要: 随着计算机可读的文本信息日益增多,有效查找和利用这些信息的迫切需求使得信息检索与信息抽取技术日益重要。但传统的搜索引擎存在的一些弊端给用户带来了一定的不便,如:用户的检索需求简单表示为一组关键词,往往会丢失很多语义信息;检索返回的结果为相关链接或文档列表,用户仍需阅读文档或片段以定位到真正需要的信息。问题回答的研究解决了这些存在的问题,首先,用户可将信息检索的需求表达为自然语言描述的问题,其次,问题回答将在文档集合中搜索并返回问题的精确答案。这个任务看似简单,但对于计算机具有很大的挑战性。本文正是在这种前提下,对问题回答技术进行了探索性研究。 论文的工作主要集中在基于模式知识库实现问题回答的关键技术上,设计并实现了问题回答系统,参加了国际文本检索会议的评测。以此为基础,我们将模式匹配技术应用到了一个相关的更新的研究领域-阅读理解,并取得了好的效果。 实现模式匹配策略最关键也是最核心的任务,即建立一个完善的模式知识库。我们提出了一种基于答案类型与问题模式的问题分类体系,同时保留了问题的语义信息与结构信息。借助TREC的评测问题集作为我们的训练与测试数据,对不同的问题分类类型进行答案模式的自动学习与评价。 我们对具有复杂结构的问题实现了模式学习,包含多个问题元素的较复杂的答案模式对于抽取出正确答案更有效更可靠。这是简单模式所无法覆盖的。同时,我们对模式匹配得到的侯选答案增加了语义类型约束,使其有更高的准确率。 为了使学习到的答案模式有更好的可扩展性,我们采取了泛化策略,在模式中加入了实体名的信息,这样,模式组成结构中不仅包含词形,也融入了语义信息,使其具有较好的鲁棒性。 答案模式的评价指标采用了数据挖掘中的可信率(Confidence)与支持率(Support)。高可信率的答案模式有更高的可靠性抽取到正确答案。 在阅读理解系统的实现中,我们引入了WordNet的同义词信息、模式匹配和上下文辅助策略,取得了明显的效果,进一步提高了系统性能,性能超过了之前的最好结果。

论文目录:

第一章 问题回答介绍

1.1 问题回答的背景

1.1.1 TREC QA简介

1.1.2 Reading Comprehension简介

1.2 问题回答研究现状

1.2.1 问题回答任务及发展概述

1.2.2 问题回答系统评价

1.3 阅读理解研究现状

1.3.1 阅读理解任务描述

1.3.2 阅读理解系统评价

1.4 问题回答与信息检索及信息抽取之间关系

1.5 本文组织结构

第二章 基于模式学习的问题回答

2.1 介绍

2.1.1 基于模式学习的问题回答系统组成

2.1.2 问题回答系统中的模式学习及相关工作

2.1.2.1 人工构建模式

2.1.2.2 自动学习模式

2.1.3 信息抽取中的模式学习

2.2 基于模式的问题回答系统结构

2.2.1 问句分析

2.2.2 文档片段检索

2.2.3 答案抽取

2.3 问题回答实例

2.4 本章小结

第三章 模式知识库的建立

3.1 介绍

3.2 问题分类模式

3.2.1 答案类型分类

3.2.2 问题模式

3.2.3 问题分类

3.3 答案抽取模式

3.3.1 问句转换模式

3.3.2 模式自动学习算法

3.3.3 模式泛化

3.4 模式评价算法

3.5 模式库总体描述及性能

3.6 本章小结

第四章 模式知识库的应用

4.1 介绍

4.2 查询扩展应用

4.3 答案抽取应用

4.3.1 基于模式的答案抽取

4.3.2 基于距离和实体名识别的答案抽取

4.3.3 Definition类型问题回答

4.4 QA系统性能评价

4.4.1 检索参数对系统性能影响

4.4.2 答案排序对系统性能影响

4.4.3 训练样例数目对系统性能影响

4.5 错误原因分析

4.6 本章小结

第五章 阅读理解

5.1 介绍

5.2 策略

5.2.1 BOW及扩展BOW

5.2.1.1 同义词扩展

5.2.1.2 赋权值

5.2.2 模式匹配

5.2.3 上下文辅助

5.3 实验结果及性能分析

5.3.1 实验结果

5.3.2 性能分析

5.5 阅读理解任务与问题回答任务的差异性

5.6 本章小结

第六章 总结与展望

6.1 工作总结

6.2 展望

参考文献

攻读博士学位期间主要工作

致谢

论文独创性声明

论文使用授权声明

发布时间: 2005-09-19

参考文献

  • [1].问题回答系统中的问题分类研究[D]. 李鑫.复旦大学2007

相关论文

  • [1].基于本体知识库推理的语义搜索研究[D]. 文坤梅.华中科技大学2007
  • [2].文本过滤关键技术研究[D]. 夏迎炬.复旦大学2003
  • [3].关于计算机理解自然查询语言的研究[D]. 郑逢斌.西南交通大学2004
  • [4].文本分类及其相关技术研究[D]. 李荣陆.复旦大学2005
  • [5].问题回答系统中的问题分类研究[D]. 李鑫.复旦大学2007

标签:;  ;  ;  ;  ;  ;  

基于模式知识库的问题回答关键技术研究
下载Doc文档

猜你喜欢