论文摘要
现有的OCR (Optical character recognition,光学字符识别)技术可以将印刷体文档中的文字高速、自动地输入计算机,取得很好的识别效果。然而脱机手写汉字,由于形状千差万别,且因人而异,现有OCR技术对其进行处理时的可靠性和准确性都难以满足实际需求。因此,加强脱机手写汉字识别的研究就显得尤为迫切。脱机手写汉字识别中,特征提取和分类器设计是两大主要问题。文中设计了一种提取纹理特征进行汉字识别的方法,把汉字看作是含有特殊纹理信息的图像,把汉字识别看作是纹理鉴别,这种方法是与内容无关的,不需要局部微细特征分析。由于汉字字符集庞大,若将输入的未知汉字特征与字典中的全部汉字特征进行逐一比较,不仅识别效果不理想,而且计算量很大,将会影响到系统的识别速度。所以,系统中采用先粗分类再细识别的两级分类策略,首先提取粗网格特征,利用树形分类器对汉字进行粗分类,然后利用二维实Gabor滤波器提取纹理特征,使用欧氏距离分类器来完成细识别任务。在识别系统中,为了适应不同书写风格的手写体汉字,增强识别特征的鲁棒性,字典中为每个汉字存储了多个不同的特征向量。通过对不同书写风格样本集的实验表明,本文设计的识别方法能够得到较好的识别率和令人满意的处理速度。
论文目录
相关论文文献
标签:光学字符识别论文; 脱机手写汉字识别论文; 纹理特征论文; 滤波器论文; 分类器论文;