基于农业本体问句分析的问答系统研究与架构设计

基于农业本体问句分析的问答系统研究与架构设计

论文摘要

近二十年以来,随着计算机技术、网络技术的在农业领域的飞速发展和广泛普及,农业领域信息技术的应用越来越受到社会关注,农业信息涉及用户覆盖面越来越广泛。农业信息化技术发展面临着新的挑战,特别是如何适应农业不同层次用户的需求,如何把农业技术通过信息技术快速、准确的传送到农业用户,成为农业信息服务建设领域面临的紧迫问题。问答系统是一个综合应用人工智能、信息检索、自然语言处理、信息抽取等技术的综合信息系统,它提供了一个简单的用户输入接口,对用户使用自然语言提出的问题,进行分析、处理,返回给用户一个简洁的答案。比较符合农业用户的需求。把问答系统应用于农业信息领域,通过对农业领域信息的检索、抽取、挖掘,可以解决农业领域技术涉及知识面广、系统结构复杂的问题,可以提高信息获取的精准度。本文结合问答系统的组成部分,分别对其中的若干关键问题进行了研究:1、本文首先对自然语言处理、信息检索、信息抽取、本体论等理论基础和发展现状给予介绍分析;结合学者们在问答系统方向的研究成果,给出问答系统的逻辑组成,然后按照系统组成分别对研究重点和难点给予分析。结合我国农业现状,分析了当前农业信息技术所面临的问题,提出了把问答系统应用到农业领域的可行性。2、对农业本体的构建进行了讨论,一是研究了本体中的基本概念,本体构建的规范和流程;二是重点研究了本体构建中概念、关系的抽取方法,为解决由农业叙词表转换农业本体中出现的本体关系稀疏的问题,为此本文提出了基于互信息的有监督本体关系抽取方法。3、对问句分析中的相关问题进行了研究,主要内容:一是引入了领域特征词的概念,用其来描述本体中的关系;二是提出了基于隐马尔可夫链的领域特征词识别抽取算法,由此实现对问句中蕴含的语义信息和领域中特征词的分析;三是研究了问题分类的方法,给出了基于本体的概念相似度计算方法,提出了基于问句特征词与问题分类特征词相似度的问题分类方法。4、研究基于本体的信息检索的方法,重点研究基于农业本体文档检索模型的构建方法,给出了问句与文档相关度计算方法,本文提出了构建基于领域本体的文档检索模型。5、答案抽取是问答系统的重要组成部分,本文提出了基于LAD的答案抽取方法,该方法主要由以下步骤:一是利用吉布斯(Gibbs)抽样进行推理,间接计算模型参数,获取词汇的概率分布,建立LDA主题模型;二是以Clarity度量块间相似性,并通过局部最小值识别片段边界,对文档进行段落分割;三是依据词汇的香农信息提取片段主题词,采取背景词汇聚类及主题词联想的方式将主题词进行扩充,形成段落主题词串;四是计算问句与段落主题词串的相似度,取相似度最高的段落为答案。6、研究面向农业领域的问答系统的架构设计,提出了基于云计算架构的农业问答系统的架构设计方法,系统架构中的存储系统使用开源分布式文件系统HDFS和非关系型数据库HBase;介绍分析HDFS和HBase的原理,描述了HDFS和HBase农业问答系统中的应用架构,结合上述问答系统的算法,提出了面向农业领域的问答系统逻辑构架。7、针对问答系统设计了实验方法,选择评价标准,主要进行了问句分析中领域特征词识别和问题分类实验,基于本体的信息检索实验和面向农业领域的答案抽取正确率的实验,每个实验都设计了数据模型,对实验结果给予分析,证明本文所提出方法的性能。

论文目录

  • 摘要
  • Abstract
  • 英文缩略表
  • 第一章 引言
  • 1.1 课题研究背景
  • 1.1.1 自然语言处理技术
  • 1.1.2 信息检索技术
  • 1.1.3 信息抽取技术
  • 1.1.4 本体的发展
  • 1.2 农业问答系统
  • 1.2.1 问答系统的定义
  • 1.2.2 问答系统的组成
  • 1.2.3 问答系统的分类
  • 1.3 农业问答系统发展与应用
  • 1.4 本文研究内容与组织
  • 第二章 基于农业本体的问句分析
  • 2.1 农业领域本体构建相关方法
  • 2.1.1 农业本体和农业叙词表
  • 2.1.2 本体学习相关工作
  • 2.1.3 本体关系学习方法
  • 2.2 基于互信息的农业本体学习方法
  • 2.2.1 互信息的定义
  • 2.2.2 文档集中互信息的计算
  • 2.3 问句分析
  • 2.3.1 问句分析相关工作
  • 2.3.2 问句预处理
  • 2.3.3 问句领域特征词识别
  • 2.3.4 问题分类
  • 2.4 本章总结
  • 第三章 基于农业本体的信息检索模型
  • 3.1 传统信息检索模型
  • 3.1.1 布尔模型
  • 3.1.2 向量空间模型(Vector Space Model,VSM)
  • 3.1.3 概率模型
  • 3.2 基于本体的信息检索表示模型
  • 3.3 基于领域本体的信息检索模型构建方法
  • 3.4 本章总结
  • 第四章 面向农业领域的答案抽取模型
  • 4.1 主题模型
  • 4.1.1 一元混合模型
  • 4.1.2 隐性语义索引
  • 4.1.3 概率隐性语义索引
  • 4.2 LDA 模型
  • 4.2.1 LDA 主题模型生成文档过程
  • 4.2.2 参数估计
  • 4.2.3 基于 Gibbs 的 LDA 建模过程
  • 4.3 答案抽取算法
  • 4.3.1 文本分割
  • 4.3.2 段落主题提取
  • 4.3.3 提取答案
  • 4.4 本章总结
  • 第五章 农业问答系统架构设计
  • 5.1 系统逻辑架构
  • 5.2 基于 HDFS 的问答系统存储架构
  • 5.3 MAPREDUCE 分布式计算模型
  • 5.4 基于 HBASE 的问答系统索引架构
  • 5.5 本章总结
  • 第六章 农业问答系统实验与分析
  • 6.1 基于农业本体问句分析模型的实验结果与分析
  • 6.2 基于本体的信息检索模型的实验结果与分析
  • 6.3 面向农业领域答案抽取模型的实验结果与分析
  • 6.4 本章总结
  • 第七章 总结与展望
  • 参考文献
  • 致谢
  • 作者简历
  • 相关论文文献

    • [1].农业信息智能分析关键技术探讨[J]. 南方农机 2017(02)
    • [2].基层农业信息服务体系建设的实践与思考[J]. 农技服务 2010(10)
    • [3].基于微信的农业信息扩散模式初探[J]. 湖南农业科学 2015(09)
    • [4].我国农业信息服务体系建设现状分析[J]. 农业科技与信息 2016(01)
    • [5].浅议农业新闻信息写作常见问题及对策[J]. 南方农业 2010(04)
    • [6].扎实推进新农村信息化建设[J]. 大庆社会科学 2009(02)
    • [7].浅议农业信息服务体系的建设[J]. 山西农经 2014(04)
    • [8].学会在繁荣学术与促进学科发展中的先导作用[J]. 农业图书情报学刊 2009(11)
    • [9].农业信息服务体系建设策略研究[J]. 现代企业教育 2012(08)
    • [10].江苏省农业信息服务体系建设研究[J]. 北京农业职业学院学报 2011(01)
    • [11].我国农村信息公共获取的影响因素与对策——基于江苏省宿迁地区农村信息化水平调研[J]. 农业图书情报学刊 2011(07)
    • [12].农业信息发展现状及对策[J]. 现代农业科技 2015(22)
    • [13].农业信息的采集及发布[J]. 北京农业 2013(36)
    • [14].辽宁基层农业信息服务体系建设研究[J]. 农业科技与装备 2010(08)
    • [15].一种优化的基于协同过滤的农业信息推荐系统研究[J]. 农机化研究 2011(07)
    • [16].大数据时代的澳大利亚农业信息监测预警体系[J]. 世界农业 2015(10)
    • [17].热区农业信息不对称的有效解决途径探讨[J]. 安徽农业科学 2010(26)
    • [18].农民对农业信息的需求及影响因素[J]. 山西农业科学 2016(06)
    • [19].基于农业信息搜索引擎分类器的设计与实现[J]. 农机化研究 2014(03)
    • [20].陕西省农业信息服务体系建设现状与发展研究[J]. 江西农业学报 2012(03)
    • [21].论我国农业信息的传播与发展[J]. 科技情报开发与经济 2010(03)
    • [22].试论农业信息与风险预警[J]. 中国农学通报 2014(05)
    • [23].基于信息需求视角下的农业信息功能概念模型构建[J]. 企业科技与发展 2012(17)
    • [24].关于农业信息化服务现代农业的思考——以湖南省郴州市为例[J]. 北方经济 2012(16)
    • [25].网络环境下农业信息的采集与二次加工初探[J]. 贵州农业科学 2009(12)
    • [26].农业信息基础建设与推进农村信息化[J]. 广西农学报 2008(03)
    • [27].当前网络中农业信息的获取[J]. 科技信息 2010(14)
    • [28].数字化农业文献信息资源建设的实践与展望[J]. 广西农业科学 2009(12)
    • [29].基于农业信息的搜索引擎结构分析[J]. 绥化学院学报 2013(06)
    • [30].农业信息智能分析的应用与前景[J]. 农业图书情报学刊 2008(12)

    标签:;  ;  ;  ;  ;  

    基于农业本体问句分析的问答系统研究与架构设计
    下载Doc文档

    猜你喜欢