基于XML的数据源模型研究与应用

基于XML的数据源模型研究与应用

论文摘要

数据源是数据挖掘应用的关键,目前数据预处理技术已相当成熟。数据库技术的不断发展使得在建立数据源时必须面对异构数据库问题。综合运用数据转换技术和数据预处理技术解决在异构数据库环境中建立数据源问题成为论文的研究重点。本文围绕在异构数据库环境中建立数据挖掘数据源问题,提出了在异构数据库中基于XML技术的数据源模型。在模型中把数据源建立分为两个部分:数据转换和数据预处理,定义了模型中对数据源设置的操作集,并在模型中集成数据库连接技术、XSLT处理技术、组件技术和数据预处理技术。以此模型为基础实现了Notes文档数据到关系数据库的数据转换,生成基于群件的数据挖掘的数据源及基于该数据源运用微软聚类方法进行简单分析。

论文目录

  • 提要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 群件
  • 1.1.1 群件的定义
  • 1.1.2 群件的优势
  • 1.2 工作流
  • 1.2.1 工作流的定义
  • 1.2.2 工作流的过程定义
  • 1.2.3 Petri 网与工作流建模
  • 1.2.4 工作流优势
  • 1.3 办公自动化系统
  • 1.3.1 办公自动化的定义
  • 1.3.2 办公自动化系统的层次
  • 1.3.3 办公自动化系统的应用
  • 1.3.4 办公自动化系统产生的数据分类
  • 1.4 数据挖掘
  • 1.4.1 数据挖掘现状
  • 1.4.2 数据挖掘的定义
  • 1.4.3 数据挖掘能做什么
  • 1.4.4 数据挖掘的过程
  • 1.4.5 数据挖掘的应用分类
  • 1.4.6 数据挖掘的方法
  • 第2章 数据源建立的相关问题
  • 2.1 数据的预处理
  • 2.1.1 数据清理
  • 2.1.2 数据集成
  • 2.1.3 数据变换
  • 2.1.4 数据归约
  • 2.2 异构数据库
  • 2.2.1 异构数据库的异构性
  • 2.2.2 异构数据库比较实例
  • 2.2.3 异构数据库的数据转换目标
  • 2.2.4 异构数据库的数据转换
  • 2.3 运用XML 实现异构数据库的数据转换
  • 2.4 数据源的建立过程
  • 2.4.1 数据转换
  • 2.4.2 数据预处理
  • 第3章 数据源模型
  • 3.1 数据源模型的相关工具
  • 3.1.1 XML
  • 3.1.2 XSLT
  • 3.1.3 DTD
  • 3.1.4 XML Schema
  • 3.2 数据源模型定义
  • 3.2.1 数据源属性
  • 3.2.2 数据输入
  • 3.2.3 数据处理
  • 3.2.4 数据输出
  • 3.2.5 数据源的格式定义
  • 3.2.6 数据源的管理
  • 第4章 实例研究
  • 4.1 流转记录库的设计
  • 4.1.1 流转记录的产生
  • 4.1.2 流转记录的结构
  • 4.1.3 流转记录库的功能
  • 4.2 数据源的建立过程
  • 4.3 Domino 对 XML 的支持方式
  • 4.3.1 XML 的使用方法
  • 4.3.2 XML 的处理工具
  • 4.4 数据转换的同步
  • 4.4.1 COM
  • 4.4.2 Domino 对COM 的支持
  • 4.5 数据源的格式描述
  • 4.6 数据源的格式转换
  • 4.7 运用OPEN XML 将数据保存到关系数据库
  • 4.7.1 数据库表的设计
  • 4.8 基于数据源生成催办模型
  • 4.8.1 SQL Server 2000 对数据挖掘功能的支持
  • 4.8.2 运用微软聚类进行数据挖掘
  • 结论
  • 参考文献表
  • 摘要
  • 英文摘要
  • 致谢
  • 相关论文文献

    标签:;  ;  

    基于XML的数据源模型研究与应用
    下载Doc文档

    猜你喜欢