基于数据库集群的海洋环境数据优化存储与分布式管理

基于数据库集群的海洋环境数据优化存储与分布式管理

论文摘要

由于卫星遥感等海洋探测技术的快速发展,所获得的海洋数据呈爆炸趋势增长,数据量高达几百GB甚至于TB级的海量海洋数据库应用已经出现。海洋环境数据存在着多源多格式、数据量大的特点,而基于互联网或局域网对这些数据的访问又有速度、效率、可用性等方面的要求。本文针对这些问题,研究海量数据优化存储方法以及基于数据库集群的分布式数据管理技术,提高海洋数据管理的整体性能和系统的可靠性。论文的主要研究内容和成果如下:1.海洋环境数据优化存储研究由于海洋环境数据应用具有面向查询的特点,查询效率和存储空间占用量是进行海洋环境数据库建设所要考虑的最重要的因素。基于这种实际需求,对海洋数据优化存储进行研究,研究包括三个方面:改造传统关系存储模式;研究数据分片方法;研究相应的数据操作方法。本文提出了一种新的类似网格结构的关系模式Grid_R来管理海洋数据,该结构类似数据采集的实际地理经纬度网格,除了时间,纬度,将所有的经度直接作为属性列。数据分片方法以及相应的数据操作方法研究均基于Grid_R数据组织结构。通过存储与组织的优化减少了数据库的数据冗余,磁盘空间占用量不到传统方法的1/4,减少了网络传输时的数据量,在某种意义上实现了数据压缩。单表查询效率比传统方法提高了4倍以上。2.基于数据库集群技术的海量数据分布式管理研究传统的集中式数据库系统难以有效支持基于wEB的海洋地理信息系统功能。随着数据库请求不断增加,查询方式的日益复杂,数据库服务器的负载增加,响应单个请求的速度越来越慢,对系统的稳定运行带来了不利影响。海量数据也对单服务器的存储能力提出挑战。本文将数据库集群技术应用于海洋环境数据的管理,提出使用基于中间件的数据库集群实现海量数据的分布式管理,将数据分布于不同的数据库节点上,集群中间件系统负责各节点的协作与并行处理,可以获得高性能、高可用性、高可扩展性,突破传统的集中式数据库服务器上的DBMS所固有的性能瓶颈限制。3.海洋环境数据库集群关键技术研究基于优化存储结构和分布式管理策略,对数据库集群数据分布、负载均衡以及并行查询等关键技术进行研究:提出了一种新的数据分布算法:两步分布法,将数据集分为分片数据集和复制数据集,两步分布法即先均匀分布分片数据集、再按异构节点资源权值分布复制数据集,在保证相邻数据分布在不同节点的基础上,使数据分布尽量达到均衡;提出了一种基于数据复制的动态负载均衡算法来平衡集群的负载,以达到提高整体性能的目标,并解决了局部节点过热和集群可用性问题;提出了一种并行查询算法来实现用户对集群的透明查询,将用户的全局查询进行解析,根据元数据将全局查询转化对各节点的本地查询,调用负载均衡获得最佳查询节点,然后在各节点并行执行查询,最后进行重构得到最终结果,并将结果返回用户。根据研究成果,基于海洋大气地理信息系统MAGIS(Marine and AtmosphericGeographicalInformation System)平台软件,建设了多节点海洋环境数据库集群,并开发了集群中间件分布式海洋数据管理器,实现了海洋数据的优化存储与分布式管理,提高了系统的整体性能和可靠性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景和意义
  • 1.2 相关研究综述
  • 1.2.1 海洋环境数据
  • 1.2.2 海洋环境数据应用
  • 1.2.3 海洋环境数据管理方法
  • 1.2.4 调研结论
  • 1.3 论文的内容和结构组织
  • 1.3.1 研究内容
  • 1.3.2 论文结构
  • 第2章 海洋环境数据优化存储研究
  • 2.1 传统的海洋环境数据关系模式设计方法
  • 2.2 海洋环境数据存储优化原理
  • 2.2.1 网格结构表模式设计
  • 2.2.2 经度列属性值
  • R的查询算法'>2.2.3 网格结构表GRIDR的查询算法
  • 2.3 数据分片方法
  • R模式设计遇到的问题'>2.3.1 高分辨率数据GRIDR模式设计遇到的问题
  • 3.3.2 数据分片方法
  • 2.4 优化性能对比
  • 2.5 本章小结
  • 第3章 海洋环境数据库集群元数据管理系统
  • 3.1 元数据管理概述
  • 3.2 集群元数据管理系统设计基本思想
  • 3.3 元数据管理系统分析和设计
  • 3.4 元数据管理系统实现
  • 3.5 本章小结
  • 第4章 海洋环境数据库集群技术研究
  • 4.1 数据库集群技术概述
  • 4.2 海洋环境数据库集群体系结构
  • 4.3 集群数据分布方法研究
  • 4.3.1 数据分布方法概述
  • 4.3.2 基于复制的数据分布策略
  • 4.3.2 海洋环境数据库集群数据分布方法
  • 4.4 负载均衡方法研究
  • 4.4.1 负载均衡方法概述
  • 4.4.2 海洋环境数据库集群动态负载均衡方法
  • 4.5 分布式并行查询算法
  • 4.6 本章小结
  • 第5章 基于MAGIS平台的数据库集群中间件的研发
  • 5.1 MAGIS和WEBMAGIS概述
  • 5.1.1 MAGIS概述
  • 5.1.2 WebMAGIS概述
  • 5.2 数据库集群中间件的实现
  • 5.3 研究成果验证
  • 5.3.1 数据存储优化效果
  • 5.3.2 研究成果对数据库性能的提高
  • 5.3.3 使用负载均衡对查询性能的影响
  • 5.4 本章小结
  • 第6章 总结和展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 攻读博士学位期间主要学术成果
  • 附录1
  • 相关论文文献

    • [1].分布式管理系统数据库应用与设计技术[J]. 电子技术与软件工程 2018(24)
    • [2].云计算在分布式管理系统中的应用与设计[J]. 电子技术与软件工程 2016(18)
    • [3].我的项目我做主[J]. 中国教师 2016(22)
    • [4].分布式管理系统数据库应用与设计技术研究[J]. 开封教育学院学报 2018(07)
    • [5].基于网络的分布式管理系统应用与设计[J]. 数字技术与应用 2016(03)
    • [6].数据库在分布式管理系统中的应用[J]. 电子技术与软件工程 2017(01)
    • [7].数据库在分布式管理系统中的应用与优化设计[J]. 电脑编程技巧与维护 2016(16)
    • [8].浅析分布式管理交通平台的应用特点[J]. 科技与创新 2018(21)
    • [9].分布式管理在图书馆管理中的应用[J]. 学周刊 2019(14)
    • [10].数据库在分布式管理系统中的应用及优化设计研究[J]. 信息系统工程 2017(07)
    • [11].电力通信网络分布式管理技术初探[J]. 通讯世界 2015(15)
    • [12].互联网时代分布式管理系统开发技术研究[J]. 电脑编程技巧与维护 2016(23)
    • [13].智慧协同网络族群的分布式管理机制[J]. 北京交通大学学报 2015(05)
    • [14].桥梁预警系统数据库分布式管理引擎设计[J]. 计算机工程与应用 2011(05)
    • [15].一种分布式管理的域密钥方法[J]. 计算机工程与应用 2009(25)
    • [16].基于校园网的分布式管理信息系统的研究[J]. 江西师范大学学报(自然科学版) 2009(04)
    • [17].微服务架构在分布式管理系统中的应用与设计[J]. 内江科技 2019(12)
    • [18].数据库在分布式管理系统中的应用及优化设计研究[J]. 信息系统工程 2018(01)
    • [19].“互联网+”时代分布式管理系统架构应用[J]. 电子技术与软件工程 2019(05)
    • [20].分布式管理信息系统在比赛记分控制系统中的应用[J]. 网络财富 2010(21)
    • [21].分布式管理系统架构研究与设计[J]. 信息技术与信息化 2019(07)
    • [22].气雾剂火灾危险性分布式管理模式研究及相关系统开发[J]. 广东化工 2011(11)
    • [23].第四章 课程制度的整体构建与运作[J]. 教育视界 2015(Z1)
    • [24].基于JSP技术的分布式管理系统研究与设计[J]. 数字技术与应用 2014(06)
    • [25].总部与各工程现场公路质量检测分布式管理系统建模及实现[J]. 黑龙江工程学院学报(自然科学版) 2012(04)
    • [26].三层B/S架构在分布式管理系统中的应用[J]. 信息通信 2013(04)
    • [27].基于JavaBean组件的分布式管理系统设计与实现[J]. 计算机光盘软件与应用 2014(14)
    • [28].疾病预防控制中心文档分布式管理系统设计[J]. 科技创新导报 2009(25)
    • [29].基于B/S体系架构的分布式管理系统应用设计[J]. 才智 2014(12)
    • [30].计算机网络管理系统及其管理方式探析[J]. 软件导刊 2011(06)

    标签:;  ;  ;  ;  ;  

    基于数据库集群的海洋环境数据优化存储与分布式管理
    下载Doc文档

    猜你喜欢