基于Gabor理论的脱机手写汉字识别

基于Gabor理论的脱机手写汉字识别

论文摘要

现有的OCR (Optical character recognition,光学字符识别)技术可以将印刷体文档中的文字高速、自动地输入计算机,取得很好的识别效果。然而脱机手写汉字,由于形状千差万别,且因人而异,现有OCR技术对其进行处理时的可靠性和准确性都难以满足实际需求。因此,加强脱机手写汉字识别的研究就显得尤为迫切。脱机手写汉字识别中,特征提取和分类器设计是两大主要问题。文中设计了一种提取纹理特征进行汉字识别的方法,把汉字看作是含有特殊纹理信息的图像,把汉字识别看作是纹理鉴别,这种方法是与内容无关的,不需要局部微细特征分析。由于汉字字符集庞大,若将输入的未知汉字特征与字典中的全部汉字特征进行逐一比较,不仅识别效果不理想,而且计算量很大,将会影响到系统的识别速度。所以,系统中采用先粗分类再细识别的两级分类策略,首先提取粗网格特征,利用树形分类器对汉字进行粗分类,然后利用二维实Gabor滤波器提取纹理特征,使用欧氏距离分类器来完成细识别任务。在识别系统中,为了适应不同书写风格的手写体汉字,增强识别特征的鲁棒性,字典中为每个汉字存储了多个不同的特征向量。通过对不同书写风格样本集的实验表明,本文设计的识别方法能够得到较好的识别率和令人满意的处理速度。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 文章组织
  • 第2章 脱机手写汉字识别系统
  • 2.1 脱机手写汉字识别系统组成
  • 2.2 脱机手写汉字识别研究的一般方法
  • 2.3 脱机手写汉字识别中的难点
  • 2.4 脱机手写汉字识别的主要研究内容
  • 第3章 脱机手写汉字识别的预处理
  • 3.1 切分
  • 3.2 规范化处理
  • 第4章 基于Gabor滤波器的手写汉字识别
  • 4.1 Gabor滤波器简介
  • 4.2 脱机手写汉字识别的粗分类
  • 4.2.1 粗分类的要求
  • 4.2.2 粗分类方法综述
  • 4.2.3 粗分类特征综述
  • 4.2.4 粗分类特征的提取和分类准则
  • 4.3 基于Gabor滤波器的纹理特征提取
  • 4.3.1 Gabor滤波器的定义
  • 4.3.2 Gabor滤波器的参数设定
  • 4.3.3 卷积与滤波
  • 4.3.4 纹理特征的提取
  • 4.4 标准字典结构设计
  • 4.5 分类器设计
  • 第5章 实验过程及结果分析
  • 5.1 评价标准
  • 5.2 实验过程
  • 5.3 实验结果分析
  • 5.3.1 小字符集手写体汉字识别
  • 5.3.2 一级字库手写体汉字识别
  • 第6章 结论与展望
  • 6.1 工作总结
  • 6.2 后续工作展望
  • 参考文献
  • 攻读硕士学位期间发表论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于Gabor理论的脱机手写汉字识别
    下载Doc文档

    猜你喜欢