中国移动一级经营分析系统的ETL设计与优化

中国移动一级经营分析系统的ETL设计与优化

论文摘要

摘要:ETL(数据抽取、转换、加载)是将OLTP(联机事务处理)系统中的数据抽取出来,并将不同数据源的数据进行转换和整合得出一致性的数据,然后加载到数据仓库中。ETL是构建和实施数据仓库的基本构件,也是BI(商业智能)系统的重要组成部分,并且为数据仓库的分析和应用提供了统一的接口和数据,它将复杂的业务逻辑屏蔽起来,使得数据仓库能够进行自动化处理。数据仓库可以采集、储存并分析数据,进而洞悉业务状况,它在数据分析和决策支持方面提供服务,这种系统称为联机分析处理(OLAP)系统。本文在详细介绍了数据仓库、ETL相关理论知识、Teradata数据仓库以及中国移动一级经营分析系统(简称一经系统)ETL处理机制的前提下,进一步形象的展示了一经系统中ETL机制的自动化处理精髓。在此基础上,研究出当前系统中ETL流程在数据处理过程中的不完善之处;进一步提出了ETL处理流程的优化建议,以及介绍了将这些优化建议逐步开发并加以实现的过程;最后介绍了报表开发及其在ETL流程中实现的过程,包括:报表需求获取、统计口径整理、脚本开发、数据测试与核查、统计口径核对、作业配置上线等。中国移动一级经营分析系统在业界是很成功的BI案例,它的ETL处理性能达到了很先进的水平,但ETL的数据处理速度也在很大程度上决定着整个经分系统的运行速度,对ETL的维护与优化的研究对中国移动一级经营分析系统的运行有着极其重要的作用和意义。

论文目录

  • 致谢
  • 中文摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 课题背景及研究意义
  • 1.2 中国移动一级经营分析系统及其ETL的研究现状
  • 1.3 论文的主要工作
  • 2 相关理论分析
  • 2.1 数据仓库
  • 2.1.1 数据仓库发展历程
  • 2.1.2 数据仓库基本概念
  • 2.1.3 数据库与数据仓库的比较
  • 2.1.4 企业数据仓库搭建理论
  • 2.1.5 数据仓库系统的查询特点
  • 2.1.6 数据仓库的作用和意义
  • 2.2 数据仓库与决策支持
  • 2.3 Teradata数据仓库介绍
  • 2.3.1 Teradata数据库简介
  • 2.3.2 Teradata并行处理机制
  • 2.3.3 Teradata应用工具
  • 2.3.4 使用Teradata的电信业客户分析
  • 2.4 ETL技术研究
  • 2.4.1 ETL概述
  • 2.4.2 ETL与数据仓库
  • 2.4.3 ETL价值体现
  • 3 中国移动一级经营分析系统的ETL流程介绍
  • 3.1 一经业务处理及数据仓库结构介绍
  • 3.2 一经系统数据接口规范概述
  • 3.2.1 接口双方责任及实现方式
  • 3.2.2 文件目录及维护
  • 3.2.3 接口单元详述
  • 3.2.4 纬表
  • 3.3 一经系统ETL Automation介绍
  • 3.3.1 ETL Automation目录介绍
  • 3.3.2 ETL Automation调度流程说明
  • 3.4 如何使ETL处理自动化
  • 3.4.1 调度数据库表
  • 3.4.2 后台调度脚本
  • 3.4.3 作业处理脚本
  • 3.5 ETL Automation监控工具
  • 3.6 一经系统ETL机制的优劣分析
  • 4 ETL过程优化解析
  • 4.1 增量接口重传自动化处理
  • 4.1.1 增量接口入库处理方式介绍
  • 4.1.2 增量接口重传处理过程
  • 4.1.3 增量接口自动化脚本优化
  • 4.1.4 增量接口重传优化脚本运行效果
  • 4.2 数据传输过程中入库方式的改进测试
  • 4.3 接口数据及时性处理方案变更
  • 4.4 数据仓库的优化与维护(备份数据库原理与整改)
  • 4.5 报表专题化展示,指标整合行动
  • 4.5.1 现有集团客户报表情况
  • 4.5.2 报表整合行动改进方案介绍
  • 5 ETL在具体项目中的实现
  • 5.1 "重要集团客户覆盖率"项目背景介绍
  • 5.2 重要集团客户覆盖率开发过程概述
  • 5.2.1 相关数据库表结构介绍
  • 5.2.2 一对多多对一上传方式介绍
  • 5.2.3 中间处理过程
  • 5.2.4 报表开发
  • 5.2.5 作业配置与部署上线
  • 6 总结与展望
  • 6.1 全文总结
  • 6.2 研究展望
  • 参考文献
  • 附录 A
  • 作者简历
  • 学位论文数据集
  • 相关论文文献

    • [1].命名实体识别在数字人文中的应用——基于ETL的实现[J]. 图书馆论坛 2020(05)
    • [2].ETL多数据流并行抽取系统的设计与实现[J]. 广东技术师范学院学报 2015(08)
    • [3].ETL技术在餐饮业油水分离器监测系统中的应用[J]. 数字技术与应用 2016(04)
    • [4].充分运用ETL工具,构建完整的数据仓库体系结构[J]. 科技创新与应用 2015(17)
    • [5].基于ETL技术的医院绩效管理系统设计与实现[J]. 中国数字医学 2015(11)
    • [6].基于云计算的数据仓库ETL系统研究与优化[J]. 湘南学院学报 2014(02)
    • [7].ETL多数据流并行抽取中监控的研究与设计[J]. 微计算机信息 2011(03)
    • [8].数据仓库中ETL过程及技巧浅析[J]. 中国科技信息 2009(02)
    • [9].一种面向数据仓库的ETL多层实现策略[J]. 福建电脑 2009(12)
    • [10].浅谈数据仓库中ETL的重要性[J]. 科技信息(科学教研) 2008(18)
    • [11].点击流数据仓库中的ETL技术[J]. 科技信息(科学教研) 2008(20)
    • [12].ETL技术在复杂数据迁移项目中的应用[J]. 西安工程大学学报 2008(04)
    • [13].数据仓库维度建模与ETL过程[J]. 辽宁高职学报 2008(10)
    • [14].基于子模式的关系数据到图数据ETL方法研究[J]. 计算机工程与应用 2017(12)
    • [15].汽车行业数据仓库应用敏捷型ETL过程的研究[J]. 现代计算机(专业版) 2015(34)
    • [16].基于自主式ETL的煤炭企业统一数据交换平台的设计与实现[J]. 中国煤炭 2014(08)
    • [17].基于ETL等技术的建设用地三级联动技术研究[J]. 国土资源信息化 2013(02)
    • [18].数据映射技术在ETL过程中的应用[J]. 计算机系统应用 2012(07)
    • [19].数据仓库与ETL技术在超市中的应用研究[J]. 电脑知识与技术 2011(18)
    • [20].数控机床传感器数据分析中ETL系统改进[J]. 计算机系统应用 2017(09)
    • [21].基于ETL技术的数据交换平台在电子政务领域中的应用[J]. 电脑知识与技术 2016(21)
    • [22].ETL技术在运营商数据仓库中的应用[J]. 电信快报 2015(11)
    • [23].教学管理数据仓库中ETL的实现[J]. 科技创新导报 2011(16)
    • [24].基于数据仓库的一种通用ETL工具的设计与实现[J]. 电脑知识与技术 2008(26)
    • [25].高校数据仓库多层架构设计与ETL实现[J]. 上海工程技术大学学报 2015(02)
    • [26].人保财险公司数据仓库数据ETL的设计[J]. 计算机光盘软件与应用 2014(12)
    • [27].一种人口信息共享的ETL设计方案[J]. 西南民族大学学报(自然科学版) 2011(05)
    • [28].点击流数据仓库中ETL子系统的应用研究[J]. 硅谷 2009(07)
    • [29].ETL在金融信贷风险数据仓库中的应用[J]. 中国科技信息 2009(10)
    • [30].数据仓库中ETL技术的研究与改进[J]. 甘肃科技 2012(19)

    标签:;  ;  ;  

    中国移动一级经营分析系统的ETL设计与优化
    下载Doc文档

    猜你喜欢