数据挖掘在宽带客户报修数据分析中的研究与应用

数据挖掘在宽带客户报修数据分析中的研究与应用

论文摘要

数据挖掘是解决数据丰富而知识匮乏的有效途径,其实质是从数据库或数据仓库中提取隐含的、未知的有用信息的过程。它被认为是数据库研究中应用前景极其广阔的一个领域。数据挖掘的目的是充分分析和理解数据,寻找数据内部隐藏的知识,并将知识以特定的模式表示出来。在数据挖掘技术的理论研究上,国内外已经取得了令人瞩目的成果;在应用的研究上,数据挖掘技术已经成功的应用到许多商业领域,并获得了良好的商业效益。随着网络技术的发展,企业业务也日益网络化、全球化。网络已经成为企业正常运营中必不可少的工具。因此,网络的性能越来越受到人们的关注。所以,挖掘分析网络报修数据,对于发现网络故障发生的根源、寻找排除故障的最佳途径具有重大意义。对网络服务提供商而言,挖掘分析报修数据,寻找导致故障的关键因素,及时排除导致故障的根源,有助于提高网络性能,树立良好的商业形象;对于网络用户而言,稳定、快速的高性能网络能提高企业的业务效率,增加经济效益。本文首先分析讨论了数据挖掘技术现状及发展趋势、数据挖掘系统的架构、数据挖掘的基本过程、数据挖掘的主要任务、数据挖掘的主要应用领域;然后介绍了决策树的基本概念,研究了决策树的常见算法及其最佳分裂属性选择方法和剪枝算法等。本文中使用的数据来源于上海某网通公司的客户服务部,以SQLServer 2005作为数据存储和管理平台,采用联机分析处理和数据挖掘作为数据分析的手段,运用商业智能平台进行应用程序的开发、展示挖掘结果,完成了基于决策树算法的网络故障报修数据的挖掘与分析。首先,根据业务需求和挖掘对象的特征确定挖掘任务;第二,对源数据进行汇总、清理、转换和消除噪声等数据预处理工作;最后,运用SQL Server 2005数据挖掘组件建立数据源连接、数据源视图,挖掘结构和构建决策树挖掘模型,进行数据挖掘。基于决策树算法的挖掘分析实现了对故障原因和故障类别的分类挖掘,取得了较好的分类效果,并结合网络实际的情况对挖掘结果进行了分析,给出网络维护的建议。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景与意义
  • 1.2 数据挖掘研究现状
  • 1.3 数据挖掘的分支
  • 1.3.1 空间数据挖掘
  • 1.3.2 多媒体数据挖掘
  • 1.3.3 时序数据和序列数据挖掘
  • 1.3.4 文本数据挖掘
  • 1.3.5 web数据挖掘
  • 1.4 数据挖掘发展方向
  • 1.5 本文的研究内容
  • 1.6 论文的组织结构
  • 1.7 小结
  • 第二章 数据挖掘技术
  • 2.1 数据挖掘简介
  • 2.1.1 数据挖掘的概念
  • 2.1.2 数据挖掘工具
  • 2.1.3 数据挖掘的过程
  • 2.1.4 数据挖掘的任务
  • 2.1.5 数据挖掘的应用领域
  • 2.2 分类理论概述
  • 2.2.1 决策树分类
  • 2.2.2 关联分类
  • 2.2.3 神经网络分类
  • 2.2.4 贝叶斯分类方法
  • 2.3 数据挖掘方法评价标准与尺度
  • 2.4 Microsoft SQL Server 2005数据挖掘平台
  • 2.4.1 Microsoft SQL Server 2005商业智能平台简介
  • 2.4.2 SQL Server 2005数据挖掘功能的优势
  • 2.4.3 Microsoft决策树算法
  • 2.5 小结
  • 第三章 决策树分类算法
  • 3.1 分类概念
  • 3.2 决策树分类算法
  • 3.2.1 ID3算法
  • 3.2.2 C4.5算法
  • 3.2.3 CART算法
  • 3.2.4 Microsoft决策树算法
  • 3.3 决策树构建的关键技术
  • 3.3.1 决策树的生长
  • 3.3.2 树剪枝算法
  • 3.3.3 剪枝原则
  • 3.5 决策树评价标准
  • 3.5.1 过度拟合
  • 3.5.2 有效性
  • 3.5.3 决策树的复杂程度
  • 3.6 本课题的研究方法与技术
  • 3.6.1 研究方法
  • 3.6.2 应用技术
  • 3.7 小结
  • 第四章 决策树在网络保修故障分析中的应用
  • 4.1 数据预处理
  • 4.1.1 业务问题定义
  • 4.1.2 网络故障预测实施过程
  • 4.1.3 网络故障报修数据的预处理
  • 4.1.4 故障报修数据抽取
  • 4.1.5 故障报修数据清洗
  • 4.1.6 故障报修数据选取
  • 4.1.7 故障报修数据转换
  • 4.2 数据挖掘系统
  • 4.2.1 系统架构
  • 4.2.2 关键技术
  • 4.3 运用Microsoft SQL Server 2005 Analysis Services分类分析
  • 4.3.1 Microsoft决策树算法实施
  • 4.3.2 分类属性的选择
  • 4.4 挖掘结果分析与评价
  • 4.4.1 故障原因挖掘结果
  • 4.4.2 故障原因挖掘分析
  • 4.4.3 故障类型挖掘结果
  • 4.4.4 故障类型挖掘分析
  • 4.5 小结
  • 第五章 总结与展望
  • 参考文献
  • 攻读学位期间的研究成果目录
  • 致谢
  • 相关论文文献

    • [1].中小银行数据挖掘思路浅析[J]. 金融电子化 2020(05)
    • [2].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [3].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [4].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [5].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [6].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [7].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [8].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [9].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [10].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [11].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [12].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [13].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [14].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [15].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [16].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [17].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [18].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [19].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [20].浅析数据挖掘[J]. 内江科技 2020(06)
    • [21].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [22].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [23].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [24].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [25].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [26].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [27].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [28].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [29].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [30].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)

    标签:;  ;  ;  ;  ;  

    数据挖掘在宽带客户报修数据分析中的研究与应用
    下载Doc文档

    猜你喜欢