中文问答系统的研究与实现

中文问答系统的研究与实现

论文摘要

问答系统是信息检索分支,属于精确检索。问答技术是自然语言处理领域中一个非常热门的研究方向,它综合运用了各种自然语言处理技术,是国内外信息技术的研究热点。目前,国内外有很多的科研机构参与了英文问答技术的研究,甚至己经有相对成熟的英文问答系统,但是参与中文自动问答技术研究的科研机构并不是很多,而且基本没有成型的中文问答系统。本文正是对中文问答技术研究的一个探索。问答系统是自然语言处理研究的应用系统,它包括了自然语言处理、信息检索等方面的基本技术,例如词法分析,大规模文档的索引建立、检索、排序等等。本文中,问答系统分为查询问句分析、信息检索、相似度计算三大部分。查询问句分析在问答系统中对问句理解起着重要的作用。一般的,查询句分析需要进行词法、句法分析以及查询句分类、关键词提取与扩展等。本文讨论了基于词法分析的查询问句分析技术,构建了针对问答系统领域的停用词词表,根据分词、词性标注、名实体识别并结合停用词词表来抽取关键词,并根据词性设置不同关键词的重要程度和对关键词进行适当的扩展。信息检索模块是问答系统中最重要的模块之一,检索的结果对后面的处理,以至找到问题的正确答案都有很大的影响。本文中对布尔模型、向量空间模型、概率模型做了简要介绍,为了满足问答系统高效、快速的需求,实现了基于向量空间模型的问答对检索系统。为了能够将与查询问句最相关的问答对返回出来,本文中设计了一种基于统计信息和语言学知识相结合的问句相似度计算方法。基于向量空间模型的相似度原理,本文改进了向量空间模型的问句相似度计算方法,使其适合问句匹配;并且计算了问句之间的语义相似度。并将这两种相似度结合作为查询问句和问答对之间的最后相似度,这种问句相似度的计算方法能够更好的返回问句匹配答案。最后,我们抽取14个领域类别的测试问题作为语料进行测试,通过对实验结果的分析,可以看出本文所实现的中文问答系统具有高效、准确、快速等特性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究的背景和意义
  • 1.2 问答系统的分类
  • 1.3 问答系统的研究现状
  • 1.4 本文的主要研究内容
  • 1.5 论文组织
  • 第2章 基于词法分析的查询问句分析
  • 2.1 查询问句分析研究现状综述
  • 2.2 查询问句分析流程
  • 2.3 查询问句预处理
  • 2.3.1 中文分词
  • 2.3.2 词性标注
  • 2.3.3 去停用词
  • 2.4 基于词法分析的查询问句关键词抽取与扩展
  • 2.4.1 关键词抽取
  • 2.4.2 关键词扩展
  • 2.4.3 关键词抽取与扩展的评价
  • 2.5 本章小结
  • 第3章 问答对检索模型
  • 3.1 信息检索的定义与发展
  • 3.2 经典的信息检索模型
  • 3.2.1 布尔模型
  • 3.2.2 向量空间模型
  • 3.2.3 概率模型
  • 3.3 基于向量空间模型的问句检索关键技术研究
  • 3.3.1 特征项选择
  • 3.3.2 特征项赋权
  • 3.3.3 倒排索引的数据格式
  • 3.4 倒排索引创建
  • 3.4.1 索引创建
  • 3.4.2 索引归并
  • 3.5 检索服务实现
  • 3.5.1 检索服务系统结构
  • 3.5.2 检索功能实现
  • 3.6 实验分析
  • 3.6.1 索引创建实验
  • 3.6.2 检索效率实验
  • 3.7 本章小结
  • 第4章 基于统计信息和语言学知识相结合的问句相似度计算
  • 4.1 一种改进的基于向量空间模型的问句相似度计算
  • 4.1.1 基于向量空间模型的相似度原理
  • 4.1.2 改进的基于向量空间模型的问句相似度公式
  • 4.2 基于HowNet(知网)的词语相似度
  • 4.3 基于语义信息的问句相似度计算
  • 4.3.1 问句语义相似
  • 4.3.2 基于语义信息的问句相似度公式
  • 4.4 基于统计信息和语言学知识相结合的问句相似度公式及评价
  • 4.5 本章小结
  • 第5章 中文问答系统的设计与实现
  • 5.1 中文问答系统总体架构
  • 5.2 中文问答系统的实现
  • 5.2.1 查询问句分析的实现
  • 5.2.2 问答系统中问句检索的实现
  • 5.2.3 问句相似度计算的实现
  • 5.3 实验分析
  • 5.3.1 实验设置
  • 5.3.2 评价标准
  • 5.3.3 实验结果及分析
  • 5.3.4 开放性测试
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].西中文作品[J]. 中国书法 2011(09)
    • [2].《国际中文教育学报》征稿启事[J]. 世界汉语教学 2020(02)
    • [3].2019年国际中文教育大会闭幕[J]. 孔子学院 2020(01)
    • [4].基于文化产业振兴背景的高职院校中文教育研究[J]. 科学咨询(教育科研) 2020(04)
    • [5].印度的中文教育:综述与评估[J]. 南亚东南亚研究 2020(05)
    • [6].紡織月刊[J]. 纺织服装周刊 2018(21)
    • [7].紡織月刊[J]. 纺织服装周刊 2017(44)
    • [8].中文塑造了我的人生[J]. 孔子学院 2018(02)
    • [9].中文版音乐剧的价值和意义[J]. 上海艺术评论 2018(05)
    • [10].基于中英文可比较语料的中文零指代消解[J]. 北京大学学报(自然科学版) 2017(02)
    • [11].增强中文自信 助推中华文化复兴——周善甫的中文观述评[J]. 云南师范大学学报(对外汉语教学与研究版) 2017(02)
    • [12].在邕高校泰国留学生阅读中文书籍现状调查研究与分析[J]. 才智 2017(28)
    • [13].西中文作品欣赏[J]. 美与时代(中) 2014(12)
    • [14].论在外语院系中加强中文课教育的意义[J]. 戏剧之家 2015(10)
    • [15].全家都来学中文[J]. 廉政瞭望(上半月) 2015(10)
    • [16].《高校应用数学学报》第三十卷A辑(中文版)总目次[J]. 高校应用数学学报A辑 2015(04)
    • [17].“厦大中文百年”征稿启事[J]. 厦大中文学报 2020(00)
    • [18].香港中文大学宾馆[J]. 金山 2019(08)
    • [19].香港中文大學[J]. 英语画刊(高级版) 2019(25)
    • [20].中文、悟性和悟性享受[J]. 基础教育论坛 2013(20)
    • [21].中文教育之痛[J]. 教师博览 2010(04)
    • [22].该死的中文秘书台[J]. 教师博览 2011(02)
    • [23].探析文化产业振兴与高校中文教育改革[J]. 长江丛刊 2018(02)
    • [24].唐中文作品[J]. 文化月刊 2015(35)
    • [25].好惨的中文课[J]. 课外阅读 2016(05)
    • [26].一不留神,我要读中文系的博士了[J]. 大学生 2016(17)
    • [27].重建中文之美[J]. 百花洲 2016(01)
    • [28].学中文的骄傲[J]. 快乐作文 2015(Z3)
    • [29].孙中山(银奖)[J]. 上海集邮 2015(S1)
    • [30].我和中文做朋友[J]. 快乐作文 2014(Z5)

    标签:;  ;  ;  

    中文问答系统的研究与实现
    下载Doc文档

    猜你喜欢