Print

网格计算系统中短作业调度模块的设计与实现

论文摘要

利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”,这种计算方式叫网格计算。网格计算使得人们充分利用网络中的各种资源,协调计算机网络中作业的运行,为用户提供一体化信息和应用服务。本论文以Platform公司的网格计算产品LSF为基础,针对根据该产品在调度过程中对于短作业调度性能效率上的缺点提出研究方案,并设计实现短作业调度的独立模块。有效的控制了短作业调度过程中性能消耗过高的问题。使得产品的调度在大量短作业的情况下,作业调度更加有效和合理。本文中设计实现的内容符合原有的网格计算产品的理念,充分利用了已有的产品,并且以现有的产品框架为基础,开发了独立运行于原产品之外的调度模块,使得原有调度过程中调度负载降低。工作的内容涵盖了为短作业调度模块设计总体的结构以及同原主系统的交互,为其设计并实现作业在其中的调动过程和资源配置方式。本文研究的主要存在的问题和技术关键点包括了短作业调度优化的问题,降低并行冲突的控制,基于检查点技术的容错处理和任务重新运行的机制,资源收集分配和控制。通过对本文中内容的研究,最终实现了短作业调度模块与原产品的完全整合,在能够合理的分配计算资源且有一定容错措施的基础上,达到了提高短作业调度性能的目的。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的背景及研究目的
  • 1.2 与本课题相关的国内外研究综述
  • 1.3 本论文的主要工作内容
  • 1.4 本文组织结构
  • 第2章 短作业调度模块的需求分析
  • 2.1 短作业调度模块背景产品分析
  • 2.2 短作业调度需求的提出
  • 2.3 功能需求
  • 2.4 非功能需求
  • 2.5 技术难点
  • 2.6 本章小结
  • 第3章 短作业调度模块的设计
  • 3.1 模块功能及结构设计
  • 3.2 短作业调度主模块的设计
  • 3.3 短作业调度子模块的设计
  • 3.4 错误消息日志的设计
  • 3.5 数据结构设计
  • 3.6 本章小结
  • 第4章 短作业调度模块的实现
  • 4.1 短作业调度主模块的实现
  • 4.2 短作业调度子模块的实现
  • 4.3 模块间交互的实现
  • 4.4 错误消息及日志记录的实现
  • 4.5 技术难点在实现中的解决
  • 4.6 本章小结
  • 第5章 短作业调度模块的测试及分析
  • 5.1 功能性测试及分析
  • 5.2 性能测试及分析
  • 5.3 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 个人简历
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/6c0e0064a2655f83c68b0016.html