数据空间数据源内容关联发现方法研究

数据空间数据源内容关联发现方法研究

论文摘要

当今社会,迅速增长的数据出现了多样性,异构性以及海量等新特点,也出现了多种数据管理方式。这些管理方法基本是模式驱动型管理方式,而模式驱动型管理方法无法解决数据管理目前所遇到的瓶颈以及挑战。数据空间(DataSpace)就是在这样一种形势下提出来的。数据空间是与主体相关的所有数据及其关系的集合,它支持多种异质异构形式的数据,具有自我演化的能力,采用pay‐as‐you‐go的进化方式,Best‐effort的查询服务方式,自动抽取数据模式,为用户存储、查询、搜索、更新、管理数据提供便捷的帮助,从而实现对多种数据源的统一管理,并且实现对数据的轻量级的高效管理。本文主要研究数据空间中数据源之间的关联发现方法,主要工作包括:第一、提出一个词语相关度模型,以之作为在数据空间中发现数据源内容关联的一个基础。通过对知网(HowNet)层次结构和概念组织形式的分析,采用知网作为词语相关度计算模型的语料库,计算同种词性以及不同词性之间的相关度,融合了词语的相似度、关联度和实例因素,综合起来获得词语的内在相关性。综合对比实验验证本文所提出的词语相关度模型所计算的的词语相关度值更符合人们主观上对词语相关性的认识。第二、从自然语言处理的角度出发,以词语相关度模型为基础,设计一个数据空间的数据源内容的关系发现机制,从而为本课题研究小组创建索引、浏览、搜索、查询以及其他服务提供良好的基础。本文对数据空间内容关联的发现机制进行研究,以词语相关度模型为基础,从反映内容的刻面角度进行关系发现。为本课题的进一步研究作了一些探索性的工作。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 论文研究背景
  • 1.2 国内外相关研究
  • 1.2.1 数据空间的相关研究
  • 1.2.2 数据关系发现研究
  • 1.2.3 相关技术研究
  • 1.3 论文的研究内容
  • 1.3.1 课题来源以及结构基础
  • 1.3.2 论文的主要研究工作
  • 1.3.3 论文特色和创新点
  • 1.4 论文的章节结构
  • 第2章 一个数据空间原型系统
  • 2.1 引言
  • 2.2 数据空间原型系统
  • 2.2.1 数据源管理子系统框架
  • 2.2.2 刻面描述
  • 2.3 本章小结
  • 第3章 基于 HOWNET 的词语相关度模型
  • 3.1 引言
  • 3.2 语义相关度模型
  • 3.2.1 语义相关概念
  • 3.2.2 建立词语语义相关度模型
  • 3.2.3 实验结果与讨论
  • 3.3 本章小结
  • 第4章 数据空间数据源内容的关系发现机制
  • 4.1 引言
  • 4.2 刻面原型
  • 4.3 基于刻面的相关性模型
  • 4.3.1 相同刻面的相关性匹配
  • 4.3.2 不同刻面的相关性匹配
  • 4.3.3 属性值相关度计算
  • 4.4 实例分析
  • 4.4.1 相关性分析
  • 4.4.2 关系发现
  • 4.5 本章小结
  • 第5章 结论与展望
  • 5.1 总结
  • 5.2 进一步工作展望
  • 参考文献
  • 致谢
  • 个人简历、在学期间发表的学术论文与研究成果
  • 相关论文文献

    • [1].数据时代的大数据数据源垄断法律规范[J]. 网络空间安全 2019(12)
    • [2].乡村大数据源类型研究[J]. 当代农村财经 2020(02)
    • [3].单位名录库更新:互联网大数据源及其数据质量评估[J]. 统计研究 2017(01)
    • [4].一种基于数据源分解判定业务回归测试范围的分析方法[J]. 科技创新导报 2016(34)
    • [5].基于分层抽样的重叠深网数据源选择[J]. 软件学报 2017(05)
    • [6].数据源总线化布局解决方案[J]. 化工自动化及仪表 2015(03)
    • [7].基于用户反馈的深网数据源选择[J]. 小型微型计算机系统 2012(11)
    • [8].基于本体的单一产品数据源组织研究[J]. 中国制造业信息化 2011(01)
    • [9].高职图书馆数字参考咨询数据源建设研究[J]. 当代图书馆 2011(01)
    • [10].基于主题与概率模型的非合作深网数据源选择[J]. 软件学报 2017(12)
    • [11].基于数据源向图的数据库设计中数据关系的表示工具[J]. 计算机科学 2017(S1)
    • [12].基于真值发现的冲突数据源质量评价算法[J]. 浙江大学学报(工学版) 2015(02)
    • [13].动态多数据源的研究与实现[J]. 电脑学习 2010(03)
    • [14].高校社会科学用户数据源选择偏好研究[J]. 图书馆理论与实践 2018(12)
    • [15].基于真值发现的冲突数据源质量评价算法[J]. 浙江大学学报(工学版) 2015(01)
    • [16].信息技术在“数字油田”数据源建设中的基础作用分析[J]. 科技创新导报 2011(22)
    • [17].基于分布对象的大规模多数据源互操作机制[J]. 计算机科学 2008(10)
    • [18].一种基于休眠调度的数据源拥塞控制方法[J]. 计算机研究与发展 2015(08)
    • [19].基于主题模型的深层网数据源选择算法[J]. 计算机应用 2015(09)
    • [20].基于本体的专利数据源集成的研究及应用[J]. 计算机技术与发展 2009(07)
    • [21].高效的数据源选择方式[J]. 计算机科学与探索 2010(10)
    • [22].面向多数据源的数据清洗关键技术的研究[J]. 科技资讯 2009(01)
    • [23].浅析多数据源自动化报表的研究与开发[J]. 数字技术与应用 2020(01)
    • [24].多数据源招聘信息采集的爬虫系统实现[J]. 福建电脑 2019(11)
    • [25].异构专利数据源集成系统中查询的研究[J]. 计算机应用与软件 2010(08)
    • [26].分布数据源两级分类转换处理的技术研究[J]. 机械与电子 2017(03)
    • [27].面向医学领域实体关联检索的深网数据源选择[J]. 计算机工程与应用 2016(10)
    • [28].面向专利数据的多数据源集成与表达[J]. 魅力中国 2009(36)
    • [29].面向农民的问答系统数据源构建[J]. 农业图书情报学刊 2014(05)
    • [30].非合作结构化深网数据源摘要的动态更新[J]. 微电子学与计算机 2014(04)

    标签:;  ;  ;  

    数据空间数据源内容关联发现方法研究
    下载Doc文档

    猜你喜欢