领域知识制导的数据挖掘技术及其在中药提取中的应用

领域知识制导的数据挖掘技术及其在中药提取中的应用

论文摘要

数据挖掘(Data Mining,DM)或者知识发现(Knowledge Discovery in Database,KDD)技术,是从大量数据中发现有价值的和隐藏的知识的过程,它能够解决“数据爆炸但知识贫乏”这个现实问题。在数据挖掘的整个过程中,领域知识起到非常重要的作用,它能够提高数据挖掘的效率和挖掘质量。将领域知识融入到数据挖掘整个过程之中是一个重要但还没有很好解决的课题。针对这个课题,本文做了如下几个方面的研究工作:1、论述了领域知识在每个数据挖掘阶段中所起到的作用,以及挖掘系统引入领域知识的方式;分析了目前领域知识制导的数据挖掘技术的研究现状。2、研究和实现了一个支持数据挖掘的知识库系统,用于存储和管理制导数据挖掘过程中的领域知识。总结出用于制导数据挖掘过程的七类领域知识,并采用两级知识组织方式对领域知识进行组织;实现了知识编辑、知识检索和知识选择等知识管理功能,并针对各种类型领域知识设计了知识输入模型和显示模型,方便用户对知识进行输入和查阅;在知识校验时,重点考虑了规则的矛盾性和冗余性校验,确保了知识库的一致性。该知识库系统是建立在关系型数据库之上,因此它能够利用成熟的数据库管理技术进行知识管理。3、研究了基于领域知识的数据预处理技术。分析了用于数据预处理的领域知识的分类,以及基于领域知识的数据预处理系统的基本结构;分别讨论了基于领域知识的不完整数据、错误数据以及重复数据等数据清洗技术;研究了基于领域知识的数据离散化和数据概化两种数据转换技术。4、研究了领域知识制导的数据挖掘(指知识发现的一个关键环节)技术。提出了一种基于算法适用知识的挖掘算法选择系统,该系统简单,易于实现,而且允许挖掘算法动态添加;对挖掘算法的参数选择方法进行了讨论,分析了领域知识在各种参数选择方法中的作用;讨论了基于领域知识的查询优化技术,对各种查询优化方法进行了总结;讨论了元规则制导的数据挖掘技术,针对当前元规则的实例方法的不足,提出了一种新的元规则的实例方法。该方法能够大大削减元规则的候选实例集。5、研究了领域知识制导的知识评价技术。介绍了发现模式兴趣度的相关概念及评价指标,讨论了常用的规则客观兴趣度评价指标;在讨论规则的主观兴趣度时,提出了一种规则意外性的评价方法,该方法考虑了意外规则的三种形式和用户领域知识的不确定性,给出了意外性的度量函数及其实现算法;采用规则模板表示用户关于发现规则的可用方面的领域知识,在此基础上,提出了一种规则可用性的评价方法。6、实现了一个数据挖掘原型系统Miner2005。该系统集成了知识库管理、数据源选择、数据预处理、数据挖掘和知识评价等功能,且具有领域知识制导、较强的适应性和通用性等特色。7、研究了数据挖掘技术在优化中药提取工艺中的应用。中药提取是中药制造中非常重要的环节。首先讨论了中药提取过程中存在的主要问题——提取工艺参数的选择;然后应用数据挖掘技术,从中药提取工艺的历史数据中,挖掘出提取参数同中药性征描述之间的关系。挖掘出的知识可以指导工艺人员在确定某个新药的提取工艺时,科学地选取正交试验的各因素水平变化范围,进而保证正交试验得出可靠的优化结果。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 数据挖掘技术
  • 1.2 领域知识制导的数据挖掘技术
  • 1.3 论文研究目标及内容安排
  • 第二章 支持数据挖掘的知识库系统
  • 2.1 引言
  • 2.2 支持数据挖掘的知识库的特点
  • 2.3 知识库的知识组织
  • 2.4 知识编辑
  • 2.5 知识检索和知识选择
  • 2.6 知识库的校验
  • 2.7 本章小结
  • 第三章 基于领域知识的数据预处理技术
  • 3.1 引言
  • 3.2 领域知识与数据预处理
  • 3.3 不完整数据处理
  • 3.4 错误数据处理
  • 3.5 相似重复数据处理
  • 3.6 数据离散化
  • 3.7 数据概化
  • 3.8 本章小结
  • 第四章 领域知识制导的数据挖掘技术
  • 4.1 引言
  • 4.2 挖掘算法选择
  • 4.3 挖掘算法参数选择
  • 4.4 基于领域知识的查询优化方法
  • 4.5 元规则制导的数据挖掘技术
  • 4.6 本章小结
  • 第五章 领域知识制导的知识评价技术
  • 5.1 引言
  • 5.2 知识评价基本概念
  • 5.3 规则意外性的评价方法
  • 5.4 规则可用性的评价方法
  • 5.5 本章小结
  • 第六章 数据挖掘原型系统MINER2005 的实现
  • 6.1 引言
  • 6.2 MINER2005 的工作原理
  • 6.3 MINER2005 的实现
  • 6.4 MINER2005 的特点
  • 6.5 本章小结
  • 第七章 数据挖掘技术在优化中药提取工艺中的应用
  • 7.1 引言
  • 7.2 应用背景
  • 7.3 数据挖掘算法简介
  • 7.4 数据准备与处理
  • 7.5 实验分析
  • 7.6 应用实践
  • 7.7 本章小结
  • 第八章 总结与展望
  • 8.1 全文工作总结
  • 8.2 后续研究展望
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 相关论文文献

    • [1].数据挖掘技术在网络营销中的应用构架实践[J]. 营销界 2019(19)
    • [2].数据挖掘技术综述浅析[J]. 数字技术与应用 2019(10)
    • [3].基于云计算的数据挖掘技术研究[J]. 无线互联科技 2019(22)
    • [4].数据挖掘技术在录井原油性质判别中的应用[J]. 录井工程 2019(04)
    • [5].大数据挖掘技术在高职教育教学过程中的应用研究[J]. 计算机产品与流通 2020(01)
    • [6].基于大数据背景的数据挖掘技术算法研究[J]. 信息技术与信息化 2019(12)
    • [7].基于云计算技术视角的大数据挖掘技术分析[J]. 数字技术与应用 2019(11)
    • [8].基于数据挖掘技术的“肥仔水”市场潜力分析——以八爪鱼为例[J]. 电脑知识与技术 2019(34)
    • [9].数据挖掘技术在互联网领域的应用研究[J]. 电脑知识与技术 2019(36)
    • [10].数据挖掘技术在数据统计工作中的应用分析[J]. 中外企业家 2020(05)
    • [11].基于数据挖掘技术的荨麻疹治疗研究综述[J]. 科技与创新 2020(04)
    • [12].基于数据挖掘技术的创新设计思维研究[J]. 设计 2020(03)
    • [13].数据挖掘技术在中医肝系病中的应用现状[J]. 江西中医药大学学报 2020(01)
    • [14].数据挖掘技术在中医辨证施治中的应用[J]. 教育教学论坛 2020(03)
    • [15].数据挖掘技术在军队预算管理中的应用探析[J]. 财务与会计 2019(19)
    • [16].云计算背景下物联网数据挖掘技术分析与实验验证[J]. 数字通信世界 2020(02)
    • [17].数据挖掘技术在经济统计中的应用研究[J]. 中国市场 2020(08)
    • [18].基于数据挖掘技术的学情分析系统分析与设计[J]. 电脑编程技巧与维护 2020(01)
    • [19].数据挖掘技术及其分析方法在大通水文站降水规律分析中的应用[J]. 科学技术创新 2020(03)
    • [20].数据挖掘在油田开采中的应用方法分析[J]. 门窗 2019(18)
    • [21].电网故障信息数据挖掘技术的分析[J]. 科技创新导报 2019(33)
    • [22].基于数据挖掘技术的高职院校财务管理风险管控研究[J]. 河北建筑工程学院学报 2019(03)
    • [23].数据挖掘技术支持下的妇幼保健院档案整合策略[J]. 黑龙江档案 2020(01)
    • [24].基于数据挖掘技术的高校人才培养模式评价与优化[J]. 大连民族大学学报 2020(01)
    • [25].探究计算机数据挖掘技术的开发及其应用[J]. 计算机产品与流通 2020(03)
    • [26].数据挖掘技术在经济统计中的应用研究[J]. 现代商业 2020(05)
    • [27].数据挖掘技术在软件工程中的应用[J]. 信息通信 2020(02)
    • [28].管理会计中数据挖掘技术的应用研究[J]. 信息记录材料 2020(01)
    • [29].基于数据挖掘技术的图书馆个性化系统设计[J]. 长春师范大学学报 2020(04)
    • [30].数据挖掘技术在教育信息中的应用探索[J]. 信息通信 2020(03)

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

    领域知识制导的数据挖掘技术及其在中药提取中的应用
    下载Doc文档

    猜你喜欢