数据挖掘技术及其在证券领域的应用

数据挖掘技术及其在证券领域的应用

论文题目: 数据挖掘技术及其在证券领域的应用

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 王中

导师: 何丕廉

关键词: 客户聚类,关联规则和序列模式,客户行为模型,客户流失模型,决策树,股票时间序列

文献来源: 天津大学

发表年度: 2005

论文摘要: 本论文从四个方面探讨了数据挖掘理论与技术及其在证券领域的应用。第一,研究用于客户分析的聚类方法。通过挖掘客户的历史交易数据,基于客户关系管理理论提出并实现了证券行业的客户划分模型:客户自动聚类机制、同类别内客户分组机制以及模型动态更新机制。在客户自动聚类机制的实现方面,建立了资金规模、手续费收入、息差收入、操作频率等四项指标体系,通过对数据的统计相关性分析定义了加权聚类相似度公式,并通过对聚类结果的分析建立了证券行业的客户聚类效果评价指标;在同类别内客户分组机制的实现方面,提出并实现了根据客户的操作风格使用动态贝叶斯模型进行客户分组的方法。最后,使用CURE聚类算法实现了模型动态更新机制。第二,提出并实现了运用关联规则和序列模式的挖掘构造证券网上交易客户行为模型的方法,并用该模型构造Markov链转移概率矩阵,实现了网上交易行情自动推送算法,有效地提高客户网上交易实时行情的响应速度。第三,提出并实现了证券业客户流失分析RFM-ROI模型,运用信息论中信息增益理论对RFM-ROI模型进行了基于数量分析的实证。根据RFM-ROI模型,在数据挖掘的基础上用分类方法构建了客户流失分析决策树,归纳出证券行业客户流失分析的业务规则,并提出了解决决策树剪枝问题的停止阈值方法。第四,运用时间序列模式分析的概念和方法进行股票趋势的K线模式挖掘,提出了在短期趋势预测中时间窗口匹配的插值算法,然后用径向基函数神经网络挖掘出股市历史走势中隐含的时间序列模式。

论文目录:

中文摘要

ABSTRACT

第一章 绪论

1.1 选题背景和研究思路

1.2 国内外研究现状

1.3 本文主要研究内容

1.4 主要创新点

1.5 论文组织结构

第二章 CRM 与数据挖掘

2.1 客户关系管理(CRM)

2.1.1 客户关系管理的概念

2.1.2 CRM 与商业智能

2.1.3 证券业的CRM 应用—投资者关系管理

2.2 数据挖掘在CRM 中的应用

2.2.1 数据挖掘的概念

2.2.2 数据挖掘在CRM 中的应用

2.3 本章小结

第三章 证券业数据仓库构建

3.1 数据仓库的概述

3.1.1 什么是数据仓库

3.1.2 数据仓库与数据库

3.1.3 数据仓库体系结构

3.2 证券行业数据分析

3.2.1 行业应用分析

3.2.2 证券行业基础数据分析

3.3 证券行业数据仓库设计与构建

3.3.1 证券行业数据仓库设计原则

3.3.2 证券行业数据仓库模型

3.3.3 数据预处理:清理、集成和转换

3.3.4 技术实现

3.4 本章小结

第四章 客户聚类分析

4.1 聚类分析

4.1.1 什么是聚类分析

4.1.2 聚类的应用领域

4.1.3 聚类分析中的数据类型

4.1.4 主要的聚类方法

4.2 基于CRM 的客户层次划分模型

4.3 客户自动聚类实现

4.3.1 业务指标分析

4.3.2 聚类数据仓库的生成及其数据标准化处理

4.3.3 客户聚类相似度公式

4.3.4 使用层次凝聚方法实现客户聚类

4.3.5 使用K-平均算法进行客户聚类分析

4.3.6 改进的K-平均方法及对相似度公式的修正

4.4 同类别客户的分组模型

4.5 基于CURE 聚类算法的动态监测机制

4.6 本章小结

第五章 基于关联规则和序列模式挖掘的客户行为模型

5.1 证券业务需求分析

5.2 关联规则

5.2.1 关联规则概念

5.2.2 关联规则的属性

5.2.3 关联规则的挖掘

5.2.4 关联规则的主要种类

5.3 序列模式挖掘

5.4 基于关联规则和序列模式的客户历史交易数据挖掘

5.4.1 数据分析

5.4.2 使用Apriori 算法候选项集找频繁项集

5.4.3 历史交易数据的序列模式挖掘

5.5 网上交易客户行为模型

5.6 基于Markov 链的行情自动推送算法

5.7 本章小结

第六章 基于决策树的客户流失模型分析

6.1 客户流失概念

6.1.1 背景分析

6.1.2 证券业客户流失的定义

6.1.3 影响客户流失的因素

6.2 客户流失模型的建立

6.2.1 客户流失模型建立的基础

6.2.2 CRM 中的 RFM 模型

6.2.3 证券业客户流失分析的RFM-ROI 模型

6.3 基于决策树的证券业客户流失模型

6.3.1 决策树概念及其应用

6.3.2 训练集

6.3.3 基于决策树的证券业客户流失分析

6.3.4 决策树的ID3 算法

6.3.5 基于停止阈值的ID3 算法改进

6.3.6 模型评价

6.4 本章小结

第七章 基于神经网络的股票行情时间序列模式挖掘

7.1 背景介绍

7.2 股票时间序列

7.2.1 时间序列模式

7.2.2 自动匹配的时间窗口

7.3 用RBF 神经网络挖掘时间序列模式

7.3.1 RBF 神经网络结构

7.3.2 用Matlab 实现RBF 神经网络挖掘

7.4 本章小结

第八章 总结与展望

8.1 总结

8.2 展望

参考文献

发表论文和科研情况说明

致谢

发布时间: 2007-07-10

参考文献

  • [1].面向商业智能的并行数据挖掘技术及应用研究[D]. 熊忠阳.重庆大学2004
  • [2].时序数据挖掘技术及其在水质预测中的应用研究[D]. 王勇.广东工业大学2005
  • [3].科学数据网格中数据挖掘技术研究[D]. 佟强.中国科学院研究生院(计算技术研究所)2006
  • [4].数据挖掘技术与分类算法研究[D]. 刘刚.中国人民解放军信息工程大学2004
  • [5].领域知识制导的数据挖掘技术及其在中药提取中的应用[D]. 朱恒民.南京航空航天大学2006
  • [6].基于数据挖掘技术的造林决策研究[D]. 姚山.北京林业大学2008
  • [7].基于粗集的数据挖掘技术及其应用研究[D]. 曹秀英.哈尔滨工程大学2003
  • [8].基于数据挖掘技术的模糊推理系统设计[D]. 白一鸣.大连海事大学2013
  • [9].数据挖掘技术在入侵检测系统中的应用研究[D]. 李玲娟.苏州大学2008
  • [10].基于数据挖掘技术的冠心病费用研究[D]. 赵璇.北京中医药大学2018

标签:;  ;  ;  ;  ;  ;  

数据挖掘技术及其在证券领域的应用
下载Doc文档

猜你喜欢