挑战杯结题报告书

挑战杯结题报告书

挑战杯--基于鼠标的联机手写项目--结题报告

学院 Y IB I NU N I V E R S I T Y

“挑战杯”科技创新项目

结题报告

项目名称: 基于鼠标的联机汉字手写识别输入软件系统

项目负责人:雷 晓 鸣

院校班级: 计算机与信息工程学院12级创新班

指导老师: 杨 强

时间:2014.11.16

简表:

摘 要

随着计算机技术特别是互联网技术日新月异的发展,人类步入了信息时代。在中国,个人计算机已进入千家万户。在计算机上使用汉字,首先遇到的问题是如何有效地输入汉字,汉字输入直接影响着计算机中文信息处理的应用与发展。

在计算机上输入汉字,大都使用拼音法输入,常常不是拼不出,就是读不准,想用类似五笔法输入却往往不会拆字。针对这种情况,“手写式”输入方法变得越来越受大众欢迎。该方法完全符合人们的日常书写习惯,与平常书写汉字时一样,差别仅仅是使用者需要将输入的汉字写在“手写板”上,计算机通过捕获书写笔迹的点进行汉字识别,从而完成汉字输入。 论文论述了一种基于汉字笔划的联机手写汉字识别系统的研究与实现,在设计上通过实时捕获书写笔划的轨迹,识别出汉字的笔划,再根据笔划序列查找对应的汉字;当存在多个相似的笔

划序列时再根据输入笔划的像素统计结果给出最可能的结果。在实现上不需专用的“书写板”,仅用鼠标作为手写汉字输入的工具。 论文所采用的笔划识别方法是以笔划方向码的概念为基础。笔划可以细分成笔划段,本文将这些笔划段分别用8个笔划方向码来表示。在书写笔划的过程中,笔划轨迹是由一系列坐标点组成, 这些坐标点是离散的。本文用8个笔划方向码标记每1段最小直线所属的方向。每1个笔划的书写轨迹都可以产生出1个方向码序列即当前笔划的笔段序列。算法通过对方向码进行噪声处理、归并之后得到笔划的方向码序列;并通过对笔划的像素进行统计得到分区处理后的像素比例。

论文设计了基于汉字笔划的联机手写汉字识别系统的工作流程。汉字识别中

主要讨论了以下几个问题:(l)单一笔划的识别方法;(2)汉字笔划串的匹配;(3)图像统计特征的匹配以及相关问题。 在书写工整的情况下系统识别率可达到90%左右。

关键词:联机手写汉字识别;笔划;方向码;模式识别;统计特征

ABSTRACT

With the computer technology,especially the rapid development of internet

technology,mankind entered the information age. In China,many families have

personal computers. The use of Chinese characters in computers,the first encountered the problem is that how to effectively input Chinese characters. Chinese character input directly affecting the computer and information processing application

development.

Many Chinese keyboard input methods,mainly boil down to two categories:

Pinyin input method and Codes input method. When people input Chinese words into computer they have such worries. When using of phonetic input method,user

pronunciation is not correct. When using of Codes input method,user don’t know how to split the Chinese characters. In light of this situation,handwritten input

method has become increasingly popular. People can write entirely in accordance with their daily habits. When writing

characters,users only need to input the Chinese characters in “tablet”,and computer captures the points of handwriting to accompl