脱机手写体汉字识别研究与实现VC++

时间:2020-09-01 16:14:34 计算机应用毕业论文 我要投稿

脱机手写体汉字识别研究与实现VC++

毕业论文

脱机手写体汉字识别研究与实现
 
摘要:脱机手写体汉字识别是模式识别中最难解决的问题之1,其研究对汉字信息处理自动化,对开拓新1代计算机的智能输入有重要意义。
本文对脱机手写体汉字识别进行了探讨研究。研究对象为常用的手写体汉字,主要研究内容为:文字识别的原理和方法,汉字图像的预处理,汉字识别的分类算法。 本文使用了基于特征编码的多级分类识别方法,通过给字符抽取足够多的有效的特征并给特征编码实现第1级分类,对于第1级分类后仍不能区分的字符,再进入第2级分类用模板匹配的方法最终达到区分的目的,这种方法的重点在第1级分类阶段。实验结果表明这种基于特征编码的多级分类识别方法是可行有效的。在预处理阶段,本系统对字符点阵进行了预处理,为以后的特征提取和识别打下了良好的基础。在第1级分类阶段,本文采用了宽度特征、点特征和交截特征,这些特征与已有的1些特征相结合,较好的实现了在第1级分类阶段对字符的分类能力。
本系统的硬件部分由扫描仪与计算机组成,实现程序由VC++6.0完成。
关键词:脱机手写体汉字识别;光学字符识别;模式识别;特征提取


Research and Achieve Handwritten Chinese
Optical Character Recognition
 
ABSTRACT: The problem of off-line Chinese handwritten character recognition, which is important to the cohunes character information processing automation and new generation of intelligent computer input, is thought of one of the most difficult problems in the field of pattern recognition.
    This paper does research on the off-line handwritten Chinese character recognition, The research object of this system are common handwritten Chinese characters. The main research content of this thesis include: the basic theory and method of character recognition, the pre-work of script image, the classification algorithm. This dissertation brings forward and realizes the multilevel classifiable method which is based on characters coding. Above all, this method realizes the first-grade classification by extracting enough effective characters from characters and coding them, to the others which couldn’t be recognized by the first-grade classification, the method will adopt the second-grade classification using template matching to recognize these characters. The emphasis of this method stands on the first-grade classification phase. The experiment proves that this method is feasible and effective.
 In the pre-processing phase each character is fed into a pre-processor, reco this makes feature extraction and recognition easy. In the first-grade classification phase, the dissertation puts forward blank feature、the Point of intersection feature, these features combines with some existing feature ,realize the ability of classification in the s first-grade classification phase better.
This system is composed of scanner and computer. This program is completed using VC++6.0.
Keywords: off-line handwritten Chinese character recognition; OCR; pattern recognition; Feature Extraction

目录
1 绪论 1
1.1 汉字识别系统研究的意义 1
1.2 手写汉字识别中存在的问题及困难 1
1.3 汉字识别的现状与发展趋势 2
2 字符识别及其方法与基础理论 7
2.1 模式识别概要介绍 7
2.2 字符识别 8
2.2.1 系统构成 9
2.2.2 分类方法 11
2.3 图像处理基础理论 15
2.3.1 图像的表示 15
2.3.2 图像的特征表示 16
2.3.3 图像的2值化处理 18
2.3.4 2值图像的连接性 19
2.4 本章小结 21
3 HC-OCR系统预处理 22
3.1 HC-OCR系统的预处理 22
3.2 图像2值化 23
3.3 平滑 24
3.4 中值去噪 25
3.5 字符分割 25
3.6 汉字图像的归1化 28
3.7 细化 29
3.8 本章小结 30
4 HC-OCR系统基于特征编码的多级分类识别 31
4.1 特征提取 31
4.2 HC-OCR系统特征提取算法 32
4.2.1 宽度特征 32
4.2.2 点特征 33
4.2.3 横向交截特征 33
4.2.4 纵向交截特征 33
4.2.5 分布密度特征 34
4.3 HC-OCR系统的'模板匹配 34
4.4 本章小结 35
5 HC-OCR系统程序实现与测试 36
5.1 系统程序实现 36
5.1.1 系统流程图 36
5.1.2 系统的算法实现 38
5. 2 HC-OCR系统运行测试 40
5.2.1 识别测试 40
5.2.2 识别率的实验统计 43
5.3 本章小结 47
结束语 48
参考文献 49
致谢 50
 
1 绪论
1.1 汉字识别系统研究的意义
汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的贡献,并将继续发挥重要的、其它文字形式难以取代的作用。然而,汉字是非字母化、非拼音化的文字,在当今高度信息化的社会里,如何快速高效地将汉字输入计算机,已成为影响人机交流信息效率的1个重要瓶颈,也关系到计算机能否真正在我国得到普及应用。
围绕这1问题,人们提出了各种解决方案。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。
自动识别输入分为语音识别和字符识别两种。汉字识别是模式识别的1个重要分支,也是文字识别领域最为困难的问题,它涉及模式识别、图像处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、计算机、中文信息处理等学科,是1门综合性技术,在中文信息处理、办公室自动化、机器翻译、人工智能等高技术领域,都有着重要的实用价值和理论意义。
1.2 手写汉字识别中存在的问题及困难

脱机手写体汉字识别研究与实现VC++

【脱机手写体汉字识别研究与实现VC++】相关文章:

1.我国汉字识别研究的新进展

2.视觉识别系统与企业品牌建设研究

3.光学遥感图像多目标检测及识别算法设计与实现

4.尾矿库在线监测系统的研究与实现

5.基于颜色特征的藏毯图像检索研究与实现

6.原型与汉字

7.VC++中的内联

8.试论建筑幕墙企业材料管理系统的研究与实现

9.基于NIOS II车牌识别系统的设计和实现