基于支持向量机的脱机手写相似汉字识别的研究

基于支持向量机的脱机手写相似汉字识别的研究

论文题目: 基于支持向量机的脱机手写相似汉字识别的研究

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 封筠

导师: 杨扬

关键词: 支持向量机,手写体相似汉字识别,模型选择,特征选择,模糊多值分类器

文献来源: 北京科技大学

发表年度: 2005

论文摘要: 虽然脱机手写体汉字识别技术具有广阔的应用前景,但是由于脱机手写体汉字自身所特有的复杂性,使得识别系统的实现具有很大的难度,目前还没有十分成熟的产品。研究表明相似汉字的存在是影响系统识别率低的主要原因之一,因此我们必须花大力气解决手写体相似汉字的识别问题。鉴于支持向量机在小规模细分类问题上的优势,本文以脱机手写体相似汉字为对象,深入研究了基于支持向量机的手写体汉字识别中的若干核心问题,做了以下几方面具有创新性的工作:首先,基于核函数的黎曼几何分析,提出了一种SVM自动模型选择方法。该方法先利用基于粗网格与模式搜索相结合的全局优化搜索算法,依据分类器性能评价准则来获得优化的SVM模型参数;之后再采用文中所提出的新保角变换,对核函数进行数据依赖性改进,进一步提高分类器泛化能力。其次,研究了两种不同形式下的特征选择方案:①针对单目标特征选择问题,提出了一种基于单目标改进GA算法与交叉验证SVM分类的特征选择方案;②针对多目标特征选择问题,提出了一种基于Pareto优势的MOGA算法与SVM分类的特征选择方案。这两种方案均属于利用SVM分类器反馈信息的Wrapper求解方法,能在不降低系统泛化性能的情况下,获得维数较小的特征向量。然后,针对DAGSVM分类器的存在问题,提出了一种新的基于结构优化的模糊多值DAGSVM分类器。根据分类器性能评价准则,给出了训练阶段离线获得结构优化DAGSVM的算法;在识别阶段,模糊多值DAGSVM分类器利用模糊隶属度函数与平均算子获得分类识别结果。与其它基于组合策略的多值SVM分类器相比,该分类器具有更高的识别精度和识别速度。最后,在分析客观相似汉字的相似特性基础上,建立了一个较为实用的手写体相似汉字样本库,为今后的进一步研究奠定了基础;提出了一种基于小波弹性网格提取特征、利用遗传算法选择特征和SVM分类相结合的手写体相似汉字识别方案,实验结果表明了该识别方案的可行性和有效性。

论文目录:

摘要

Abstract

主要符号及其意义

引言

1 脱机手写体汉字识别技术综述

1.1 研究现状及技术困难

1.1.1 研究历史及现状

1.1.2 面临的技术困难

1.2 系统构成

1.2.1 系统构成框图

1.2.2 汉字的预处理

1.2.3 特征选择与提取

1.2.4 分类器设计

1.2.5 后处理

1.3 对进一步研究的几点思考

2 统计学习理论与支持向量机方法

2.1 问题的提出

2.2 统计学习理论的核心内容

2.2.1 VC维

2.2.2 推广性的界

2.2.3 结构风险最小化

2.3 支持向量机

2.3.1 最优分类面

2.3.2 线性可分支持向量机

2.3.3 线性不可分支持向量机

2.3.4 非线性支持向量机

2.3.5 支持向量机的训练算法

2.3.6 支持向量机与正则化理论关系

2.3.7 支持向量机多值分类器

2.3.8 支持向量机的应用及主要的研究方向

2.4 本章小结

3 SVM分类器自动模型选择方法的研究

3.1 模型选择的意义与方法

3.2 模型选择性能评价准则

3.3 基于粗网格搜索与模式搜索相结合的核参数优化

3.3.1 粗网格搜索算法

3.3.2 模式搜索算法

3.4 基于黎曼几何理论的核函数修正

3.4.1 核函数的几何特性

3.4.2 Amari S.等人的核函数修正思想

3.4.3 新的保角变换

3.4.4 核函数修正算法

3.5 实验结果与分析

3.5.1 人工非线性分类问题

3.5.2 标准数据库分类问题

3.5.3 手写体相似汉字分类问题

3.6 本章小结

4 基于遗传算法和SVM分类的特征选择方法的研究

4.1 特征选择的必要性及方法

4.2 单目标特征选择研究

4.2.1 单目标改进GA的优化选择

4.2.2 基于交叉验证的SVM分类

4.2.3 实验结果与分析

4.3 多目标特征选择研究

4.3.1 基于Pareto优化的MOGA算法

4.3.2 基于MOGA算法与SVM分类的特征选择方法

4.3.3 实验结果与分析

4.4 本章小结

5 基于优化DAG的模糊多值SVM分类器的研究

5.1 模糊SVM分类器

5.1.1 基于样本模糊化的FSVM分类器

5.1.2 基于核函数模糊化的FSVM分类器

5.1.3 模糊多值FSVM分类器

5.2 基于有向非循环图的SVM优化

5.2.1 有向非循环图

5.2.2 DAGSVM存在问题

5.2.3 DAGSVM结构的优化确定

5.3 基于模糊DAG的多值SVM分类器

5.3.1 模糊隶属度函数的确定

5.3.2 算法描述

5.4 实验结果与分析

5.5 本章小结

6 SVM在手写体相似汉字识别中的应用研究

6.1 相似汉字识别的意义及研究现状

6.2 手写相似汉字样本库的建立

6.2.1 汉字相似特性分析

6.2.2 手写相似汉字样本库建立流程

6.3 手写相似汉字识别系统的构成

6.3.1 汉字图像的规范化

6.3.2 基于小波弹性网格的特征提取

6.3.3 基于遗传算法的特征选择

6.3.4 基于SVM的分类

6.4 实验结果与分析

6.5 本章小结

结论

参考文献

附录A 部分手写体相似汉字图像与特征

A.1 部分未规范化手写体相似汉字图像

A.2 部分规范化手写体相似汉字图像

A.3 部分手写体相似汉字特征

附录B 对于不同相似字组的SVM分类器核参数设置

在学研究成果

致谢

发布时间: 2012-07-10

参考文献

  • [1].自组织学习及其在汉字识别和图象分析中的应用[D]. 邓达.华南理工大学1995
  • [2].手写虚拟汉字识别研究及其在多通道短信交互系统中的应用[D]. 杨端端.华南理工大学2007
  • [3].特定领域OCR系统的精度与速度问题研究[D]. 陈光.北京邮电大学2007
  • [4].支持向量机及其在人脸识别中的应用研究[D]. 李华庆.上海交通大学2006
  • [5].支持向量机若干基础研究及其在图像识别中的应用[D]. 业宁.东南大学2006
  • [6].最小二乘支持向量机及其在工业过程建模中的应用[D]. 陈爱军.浙江大学2006
  • [7].最小二乘支持向量机算法及应用研究[D]. 姜静清.吉林大学2007
  • [8].支持向量机若干算法研究及应用[D]. 王朝勇.吉林大学2008
  • [9].基于支持向量机的真实头模型三维重建方法的研究[D]. 郭磊.河北工业大学2007
  • [10].非平行平面支持向量机及特征提取中若干问题研究[D]. 陈素根.江南大学2016

相关论文

  • [1].无限制手写体数字串切分与识别的相关问题研究[D]. 丁杰.南京理工大学2010
  • [2].汉字字形形式化描述方法及应用研究[D]. 林民.北京工业大学2009
  • [3].脱机中文手写识别—从孤立汉字到真实文本[D]. 苏统华.哈尔滨工业大学2008
  • [4].联机手写汉字识别技术研究[D]. 吕新桥.华中科技大学2009
  • [5].基于多层次信息融合的手写体汉字识别研究[D]. 居琰.重庆大学2002
  • [6].手写体汉字识别研究[D]. 王正群.南京理工大学2001
  • [7].小类别无限制手写体汉字识别研究[D]. 朱宁波.南京理工大学2004
  • [8].基于运动图像的手写汉字识别研究[D]. 高学.华南理工大学2003
  • [9].手写体汉字识别的研究[D]. 金连文.华南理工大学1996
  • [10].支持向量机的理论与算法研究[D]. 王国胜.北京邮电大学2008

标签:;  ;  ;  ;  ;  

基于支持向量机的脱机手写相似汉字识别的研究
下载Doc文档

猜你喜欢