基于矩阵分解理论学习的数据降维算法研究

基于矩阵分解理论学习的数据降维算法研究

论文摘要

随着信息时代的到来,科研工作中经常会遇到大量的高维数据。例如图像检索、模式识别、人类基因分布、特征分类等。为了便于数据分析和探测数据的内部结构,通常采用数据降维的方法。数据降维的目的是要找出隐藏在高维数据中的低维流形结构。由于矩阵是数据全部信息的体现,为了更精准地探究数据的内部结构的变化,采用数学方法是有必要的。矩阵分解理论尤其是以二维矩阵的分解和张量的分解的学习是近年来出现在人工智能领域中的一种重要方法,并且在探索数据降维方面取得了令人瞩目的成果。近年来,出现了许多有效的基于流形学习的数据降维方法。主要包括主成分分析(PCA)、局部线性嵌入(LLE)、线性差别分析(LDA)、和近邻保留嵌入(NPE)等。这些算法都是典型的一维数据降维方法,并且已经广泛的应用于数据降维、模式识别及特征提取等领域。一维数据降维方法只能处理向量化的数据,数据的向量化过程会导致部分有用的信息丢失,而且高维数据的向量化表示会引发维数灾,导致计算复杂程度加大。这些事一维算法所面临的问题。目前,科研工作者针对这一类问题,以矩阵分解理论为基础,抽象出采用二维矩阵分解和张量分解的数据降维思想,并提出了许多有效的基于矩阵分解理论学习的数据降维方法。主要包括二维主成分分析(2D-PCA)、二维线性差别分析(2D-LDA)、张量局部差异分析(TLDE)、以及张量子空间分析(TSA)等。本文以矩阵分解原理为基础,全面的分析了现有的数据降维方法,并总结出数据降维算法理论中的重要原理,重点研究了NPE算法并对其进行了修正改进。本文的主要工作包括:(1)从矩阵的奇异值分解和张量的高阶奇异值分解两个方面,结合张量子空间分析(TSA)和张量近邻保留嵌入(TNPE)两个算法,研究矩阵分解理论与降维的结合及应用原理。(2)近邻保留嵌入(NPE)作为一种降维算法,需要先进行矩阵向量化,但是原始数据(图像矩阵)的维数通常过大,容易造成一些有用的信息丢失,不能充分的反映原始数据内部的几何拓扑特征。针对这一缺点,我们提出了一种基于矩阵分解理论学习的算法——二维近邻保留嵌入(2D-NPE)。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景
  • 1.2 预备知识
  • 1.2.1 流行学习
  • 1.2.2 张量
  • 1.3 本文研究内容
  • 1.4 论文组织结构
  • 2 矩阵分解理论在降维中的应用
  • 2.1 引言
  • 2.2 奇异值分解(SVD)与张量子空间分析(TSA)
  • 2.3 高阶奇异值分解(HOSVD)与张量近邻保留嵌入(TNPE)
  • 2.4 矩阵分解在降维中的应用原理
  • 2.5 小结
  • 3 一种基于近邻保留嵌入的算法(2D-NPE)
  • 3.1 引言
  • 3.2 NPE 算法回顾
  • 3.3 改进的NPE 数据降维方法(2D-NPE)
  • 3.3.1 构造流形空间上的邻域G
  • 3.3.2 算法及推导
  • 3.3.3 2D-NPE 算法
  • 3.4 实验对比分析
  • 3.5 小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于矩阵分解理论学习的数据降维算法研究
    下载Doc文档

    猜你喜欢