面向本体学习的粒计算方法研究

面向本体学习的粒计算方法研究

论文摘要

随着Web发展,面向主题的领域数据源(本文称为领域信息系统)不仅越来越多,而且其包含的信息非常丰富。这类数据源可以归属于半结构化数据源,具有内部结构不完整、内容不完备或不精确或不确定、数据量大、动态和分布式存储等特点。如今,从这类数据源中用于实现知识抽取和知识表示的方法正变得日益重要。然而,现有的本体学习方法基本上是基于非结构化和结构化数据源下提出的,对半结构化数据源进行本体学习时一般按基于非结构化方法进行相应处理,而没有充分考虑半结构化数据源本身具有的隐含结构特征。从现有的文献资料看很少专门介绍基于半结构化数据源的本体学习方法与技术的阐述。因此,从领域信息系统中实现知识抽取以构建近似本体必然给本体学习算法带来很大的挑战。另一方面,虽然在粒计算数据挖掘方面有不少学者进行了广泛深入的研究,但从领域信息系统这类数据源中进行基于粒计算的数据挖掘方法研究还不多见。由于粒计算在不完备、不确定信息处理和对复杂问题近似求解方面具有特殊的优势,所以针对领域信息系统,通过研究基于粒计算的数据挖掘方法不仅扩展数据挖掘、知识发现的理论与方法,而且将为在复杂数据源下的本体学习提供一条有效的途径。本文以粒计算理论为指导,针对领域信息系统就面向本体学习的粒计算方法进行了一些探索性的研究工作。本文的主要贡献表现在以下几个方面:(1)通过对领域信息系统中信息函数的扩展,给出了领域信息系统的形式化描述和相应的粗糙集,提出了面向本体学习的领域概念粒度空间模型首先,由于领域信息系统可以归属于一种半结构化数据,具有数据不完备又有数据值是多值等特点,需要对信息函数进行扩展。通过扩展的信息函数可以定义领域信息系统中对象之间的各种关系,包括等价关系,由此给出了相应的粗糙集模型,从而拓展了粗糙集应用环境。其次,从面向本体概念学习和分类学习的需要出发,针对领域信息系统提出了一种逐层粒化方法生成具有不同抽象程度的信息粒(本文称为对象粒),并从粒计算的近似概念观点出发定义了对象粒的特征描述和相应的特征支持集,构建了领域对象粒度空间。将对象粒及其特征描述结合为一个整体定义为概念粒,以此来体现领域(近似)概念。并通过层次粒化所生成的领域对象粒度空间诱导出相应的领域概念粒度空间。讨论了概念粒度空间中概念粒之间的关系、概念粒之间的运算、有关性质和领域不确定信息的粒近似表示,分析了概念粒度空间模型的特点。并将基于领域信息系统的本体概念学习和分类关系归结为概念粒度空间生成的过程。(2)针对领域本体概念和概念之间关系获取的需要,提出领域多层次概念获取的粒计算方法基于所提出的领域概念粒度空间模型,针对领域信息系统中特征值具有不确定或不精确的情形定义了具体的粒化准则,提出领域多层次概念获取算法(CGS),从而为领域信息系统的本体概念学习和分类关系学习提供了一种有效的解决方法和实现技术。并在该算法的基础上针对领域信息系统具有动态特征和分布性特征提出了领域多层次概念获取的增量方法(CGS2),从而能有效地适应动态数据源的需要。通过算法测试比较、原型演示测试,以及本体学习原型演示系统的仞步应用表明所提出的方法是有效的。(3)针对领域本体关系概念获取的需要,提出领域多维多层次之间关联关系挖掘的粒计算方法通过关联关系的挖掘来实现领域本体关系概念及非分类关系的学习是一种经常使用的方法。先前的方法是针对非结构化数据源在已经具有概念集的基础上发现概念之间的关联关系。本文应用特征值域概念层次结构和关联关系挖掘的优化策略,提出了基于粒计算的领域多维多层次关联关系挖掘算法(G—Approach)。对所提出的算法进行详细的实例说明,并选择不同类型数据集和其他典型挖掘方法进行不同角度的测试与比较。测试结果表明了所提出的方法是有效的。另外,本文所提出的领域多维多层次之间关联关系挖掘的粒计算方法是直接运行于领域信息系统上,用于发现具有不同概念层次之间的关系概念。因此,所提出的方法不仅扩展了对复杂数据源数据挖掘方法,而且为领域本体关系概念学习提供了一种有效的解决方法与实现技术。同时基于G-Approach方法提出领域多维多层次间关联关系的粒计算增量挖掘方法(G-Approach2),从而能适应动态的或分布式的领域信息系统的需要。实验测试与比较结果表明对非稠密型数据源G-Approach2方法比G-Approach方法具有更好的性能,但对完全属于稠密型数据集的测试结果却不如直接采用CGS方法好。因此,这需要我们进一步深入分析研究,以图改进增量方法使之能对稠密型数据集有更好的性能。(4)针对本体非分类关系学习的需要,提出基于不同概念粒度空间的概念粒间交叉关系获取方法针对同一领域信息系统从不同的角度或侧面构建不同领域概念粒度空间,通过分析粒间上下文,提出了基于不同领域概念粒度空间的概念粒间交叉关系获确椒āS纱宋恿煊蛐畔⑾低辰辛煊虮咎宓姆欠掷嘌疤峁┝艘恢钟行У慕饩龇椒ㄓ胧迪旨际酢?(5)提出基于粒计算的本体学习框架结合形式概念格提出基于粒计算的简单本体生成算法;提出基于粒计算的本体学习框架。该框架主要包括三个部分,一是领域概念获取,二是领域概念间关系的获取,三是将所获取的概念和关系映射为本体类和关系,包括类映射、关系映射和实例映射等;基于该框架和面向本体学习的粒计算方法设计了相应的原型演示系统,通过具体的数据集的测试运行验证了所提出的框架和算法是有效的。

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究背景与意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义
  • 1.2 本体学习研究现状及存在的问题
  • 1.2.1 本体学习技术研究现状
  • 1.2.2 存在的问题
  • 1.3 基于粒计算的数据挖掘方法研究现状和需进一步解决的关键问题
  • 1.3.1 基于粒计算的数据挖掘框架
  • 1.3.2 基于粒计算的数据挖掘方法研究现状
  • 1.3.3 不同应用环境下基于粒计算的数据挖掘方法
  • 1.3.4 有待于进一步解决的关键问题
  • 1.4 主要研究内容与成果
  • 1.4.1 主要研究内容
  • 1.4.2 主要研究成果
  • 1.5 本文的组织结构
  • 第2章 信息粒及粒计算
  • 2.1 引言
  • 2.2 粒计算发展
  • 2.3 粒计算的基本问题
  • 2.3.1 信息粒及其粒化方法
  • 2.3.2 粒层
  • 2.3.3 粒的构建和使用粒的计算
  • 2.4 几种主要粒计算模型
  • 2.4.1 基于词计算理论的粒计算模型
  • 2.4.2 基于Rough集理论的粒计算模型
  • 2.4.3 基于商空间理论的粒计算模型
  • 2.4.4 其他相关粒计算模型
  • 2.5 本章小结
  • 第3章 面向本体学习的领域概念粒度空间模型
  • 3.1 引言
  • 3.2 领域信息系统
  • 3.2.1 领域信息系统的形式化描述
  • 3.2.2 基于领域信息系统的粗糙集
  • 3.3 领域信息系统的粒化
  • 3.3.1 信息粒化
  • 3.3.2 领域信息系统粒化与领域对象粒度空间
  • 3.4 领域概念粒度空间模型
  • 3.4.1 领域概念粒和领域概念粒度空间
  • 3.4.2 领域概念粒度空间中概念粒之间关系
  • 3.4.3 领域概念粒度空间中概念粒运算
  • 3.4.4 领域不确定信息的概念粒近似表示
  • 3.4.5 领域概念粒度空间模型的特点
  • 3.5 本章小结
  • 第4章 领域多层次概念获取的粒计算方法
  • 4.1 引言
  • 4.2 不确定特征值的近似表示与领域对象粒的构建
  • 4.2.1 特征值域的粒化和特征值的粒近似表示
  • 4.2.2 领域对象的粗相等与粗相似
  • 4.2.3 构建领域概念粒度空间
  • 4.3 基于概念粒运算的领域多层次概念获取
  • 4.3.1 基于概念粒运算的领域多层次概念获取框架
  • 4.3.2 基于概念粒运算的领域多层次概念获取算法(CGS)
  • 4.3.3 实例分析
  • 4.4 领域多层次概念获取的增量方法
  • 4.4.1 领域多层次概念增量获取框架
  • 4.4.2 领域多层次概念获取的增量算法(CGS2)
  • 4.5 领域多层次概念获取算法的测试与分析
  • 4.5.1 非增量方法的测试与比较
  • 4.5.2 基于增量方法的原型测试系统
  • 4.5.3 测试结果的分析讨论
  • 4.6 本章小结
  • 第5章 领域多维多层次关联关系挖掘的粒计算方法
  • 5.1 引言
  • 5.2 基于粒计算的多维多层次关联关系挖掘
  • 5.2.1 关联规则概述
  • 5.2.2 数据模型和相关定义
  • 5.2.3 基于粒计算的领域多维多层次关联关系挖掘框架
  • 5.2.4 领域多维多层次关联关系挖掘方法(G-Approach)
  • 5.2.5 实例分析
  • 5.2.6 测试比较与分析讨论
  • 5.3 基于粒计算的领域多维多层次关联关系的增量挖掘
  • 5.3.1 增量式更新挖掘算法的分类
  • 5.3.2 领域多维多层次关联关系增量挖掘方法(G-Approach2)
  • 5.3.3 增量算法的测试比较与分析讨论
  • 5.4 不同领域概念粒度空间中概念粒间交叉关系的挖掘
  • 5.4.1 不同领域概念粒度空间中概念粒间交叉关系的挖掘模型
  • 5.4.2 算法描述
  • 5.5 本章小结
  • 第6章 领域本体学习的粒计算框架及原型演示系统
  • 6.1 引言
  • 6.2 基于粒计算的简单本体获取方法及实例分析
  • 6.2.1 数据模型
  • 6.2.2 基于粒计算的简单本体获取算法
  • 6.3 基于粒计算的领域本体学习框架
  • 6.4 基于粒计算的领域本体学习原型演示系统
  • 6.4.1 系统的运行环境和测试数据集说明
  • 6.4.2 系统的功能模块和测试过程介绍
  • 6.4.3 测试结果的分析讨论
  • 6.5 本章小结
  • 第7章 结束语
  • 7.1 本文工作的总结
  • 7.2 进一步研究的展望
  • 参考文献
  • 攻读博士期间发表和已录用的学术论文
  • 学位论文数据集
  • 相关论文文献

    • [1].省汽车站车辆进站系统正式运行[J]. 广东交通 2010(02)
    • [2].全国农机监理信息系统建设初探[J]. 农机使用与维修 2019(12)
    • [3].医院信息系统在医院管理中的应用[J]. 通讯世界 2019(12)
    • [4].基于手术麻醉信息系统的闭环管理方法探究[J]. 中国卫生质量管理 2020(01)
    • [5].微信支付在校友会信息系统的应用[J]. 中国新通信 2019(24)
    • [6].基于信息系统成功模型的用户持续使用研究综述[J]. 电子元器件与信息技术 2019(11)
    • [7].信息系统的电磁泄漏及其防护技术的研究[J]. 科技风 2020(06)
    • [8].多院区医院信息系统建设模式研究[J]. 中国医疗设备 2020(02)
    • [9].“钉钉”审批与医院信息系统自助化[J]. 中国新通信 2020(03)
    • [10].浅析信息系统数据迁移的方法[J]. 网络安全技术与应用 2020(01)
    • [11].信息系统严把质量关[J]. 企业管理 2020(03)
    • [12].基于全生命周期的医院信息系统质量管理[J]. 中国卫生质量管理 2020(02)
    • [13].基于任务驱动的信息系统运用模拟训练方法研究[J]. 当代教育实践与教学研究 2020(07)
    • [14].基于IT服务管理构建信息系统健康度模型的研究与探索[J]. 冶金自动化 2020(03)
    • [15].重要信息系统安全体系结构及实用模型[J]. 电子技术与软件工程 2020(06)
    • [16].基于医院信息系统的心电图室工作管理优化分析[J]. 中医药管理杂志 2020(05)
    • [17].无线镇痛信息系统在麻醉科的应用分析[J]. 临床医药文献电子杂志 2020(40)
    • [18].关于医院信息系统数据安全问题及应对策略[J]. 网络安全技术与应用 2020(07)
    • [19].医院信息系统急诊应急方案的探讨[J]. 中华卫生应急电子杂志 2020(02)
    • [20].网络安全是维护医院信息系统的重要因素[J]. 信息记录材料 2020(04)
    • [21].对基于电子商务的企业信息系统的几点探讨[J]. 中小企业管理与科技(中旬刊) 2020(05)
    • [22].综合医院“互联网+”随访信息系统的设计与实现[J]. 中国医疗设备 2020(08)
    • [23].信息系统人机交互中的用户情绪研究[J]. 技术与创新管理 2020(05)
    • [24].智慧航站楼信息系统的设计与实践分析[J]. 电子世界 2020(18)
    • [25].智慧与智慧信息系统[J]. 中国电子科学研究院学报 2018(06)
    • [26].有效利用信息系统提高企业竞争力[J]. 信息记录材料 2018(12)
    • [27].信息系统建设中数据工程作用浅析[J]. 电脑知识与技术 2019(01)
    • [28].基于微信小程序的健康小屋信息系统设计与实现[J]. 数字通信世界 2019(03)
    • [29].信息系统的安全保障策略[J]. 金融电子化 2019(02)
    • [30].医院信息系统在医院科学管理中的应用[J]. 智慧健康 2019(22)

    标签:;  ;  ;  ;  

    面向本体学习的粒计算方法研究
    下载Doc文档

    猜你喜欢