【技术实现步骤摘要】
本申请涉及计算机
,尤其涉及一种字符描述特征提取方法、字符识别方法、字符识别引擎生成方法、信息确定方法及装置。
技术介绍
字符识别是众多视觉创新应用的基础技术,目前,比较成熟的字符识别技术有光学字符识别(OpticalCharacterRecognition,OCR)。OCR在名片识别、证件识别和文档识别等领域都有着广泛的应用。一般来说,字符识别技术主要包括两部分内容:一部分是对样本的离线训练,另一部分是在线字符识别。其中,对于样本的离线训练的目的是建立字符识别引擎。字符识别引擎是指根据一定的策略、运用特定的计算机程序对图像进行处理,并对从图像中识别出的字符的信息进行展示的系统。一般地,建立字符识别引擎的流程如图1所示,依次包括对作为训练样本的图像的二值化处理、归一化处理、提取图像中的字符描述特征和分类器设计。其中,对作为训练样本的图像的二值化处理,是指将图像所包含的各像素的灰度值转化为特定的两个灰度值中的一个,比如转化为0或255。而在线字符识别的主要目的在于利用字符识别引擎,从输入字符识别引擎的图像中识别出字符。对应于字符识别引擎的建立方法,利用字符识别引擎进行在线字符识别的流程如图2所示,依次包括对图像的二值化处理、归一化处理、提取图像中的字符描述特征,以及利用分类器确定提取到的字符描述特征所描述字符的所属类别。由图1可以看出,现有的字符识别引擎的建立基础之一是对图像的二值化< ...
【技术保护点】
一种字符描述特征提取方法,其特征在于,包括:获得图像;确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级;根据第一灰度信息和第二灰度信息,确定字符描述特征。
【技术特征摘要】
1.一种字符描述特征提取方法,其特征在于,包括:
获得图像;
确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的
基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像
素的灰度等级;
根据第一灰度信息和第二灰度信息,确定字符描述特征。
2.如权利要求1所述的方法,其特征在于,确定第一灰度信息和第二灰
度信息,包括:
获得至少一个定位信息集合;其中,单个定位信息集合包含基准区域的定
位信息和比较区域的定位信息;
根据所述至少一个定位信息集合中包含的各基准区域的定位信息,确定所
述图像的各基准区域;
根据所述至少一个定位信息集合中包含的各比较区域的定位信息,确定所
述图像的各比较区域;
确定分别表示所述图像的各基准区域内的像素的灰度等级的各第一灰度
信息;
确定分别表示所述图像的各比较区域内的像素的灰度等级的各第二灰度
信息。
3.如权利要求1或2所述的方法,其特征在于,当获得的所述至少一个
定位信息集合的数目大于等于二时,根据第一灰度信息和第二灰度信息,确定
字符描述特征,包括:
利用根据同一定位信息集合中的各基准区域的定位信息和各比较区域的
定位信息分别确定出的第一灰度信息和第二灰度信息,确定字符描述子特征;
根据确定出的各字符描述子特征,确定字符描述子特征。
4.如权利要求3所述的方法,其特征在于,利用根据同一定位信息集合
\t中的各基准区域的定位信息和各比较区域的定位信息分别确定出的第一灰度
信息和第二灰度信息,确定字符描述子特征,包括:
利用编码算法,以及所述根据同一定位信息集合中的各基准区域的定位信
息和各比较区域的定位信息分别确定出的第一灰度信息和第二灰度信息,确定
字符描述子特征。
5.如权利要求1所述的方法,其特征在于,所述基准区域与所述比较区
域不重叠。
6.如权利要求1或5所述的方法,其特征在于,单个所述基准区域的面
积与单个所述比较区域的面积相同。
7.一种字符识别方法,其特征在于,包括:
获得图像;
确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的
基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像
素的灰度等级;
根据第一灰度信息和第二灰度信息,确定字符描述特征;
根据所述字符描述特征确定字符。
8.如权利要求7所述的方法,其特征在于,确定第一灰度信息和第二灰
度信息,包括:
获得至少一个定位信息集合;其中,单个定位信息集合包含基准区域的定
位信息和比较区域的定位信息;
根据所述至少一个定位信息集合中包含的各基准区域的定位信息,确定所
述图像的各基准区域;
根据所述至少一个定位信息集合中包含的各比较区域的定位信息,确定所
述图像的各比较区域;
确定分别表示所述图像的各基准区域内的像素的灰度等级的各第一灰度
信息;
确定分别表示所述图像的各比较区域内的像素的灰度等级的各第二灰度
信息。
9.如权利要求7或8所述的方法,其特征在于,当获得的所述至少一个
定位信息集合的数目大于等于二时,根据第一灰度信息和第二灰度信息,确定
字符描述特征,包括:
利用根据同一定位信息集合中的各基准区域的定位信息和各比较区域的
定位信息分别确定出的第一灰度信息和第二灰度信息,确定字符描述子特征;
根据确定出的各字符描述子特征,确定字符描述子特征。
10.如权利要求9所述的方法,其特征在于,利用根据同一定位信息集合
中的各基准区域的定位信息和各定位区域的定位信息分别确定出的第一灰度
信息和第二灰度信息,确定字符描述子特征,包括:
利用编码算法,以及所述根据同一定位信息集合中的各基准区域的定位信
息和各比较区域的定位信息分别确定出的第一灰度信息和第二灰度信息,确定
字符描述子特征。
11.如权利要求7所述的方法,其特征在于,所述基准区域与所述比较区
域不重叠。
12.如权利要求7或11所述的方法,其特征在于,单个所述基准区域的
面积与单个所述比较区域的面积相同。
13.一种字符识别引擎生成方法,其特征在于,包括:
获得图像集合;
分别确定所述图像集合包含的各图像的第一灰度信息和第二灰度信息;其
中,第一灰度信息表示基准区域内的像素的灰度等级;第二灰度信息表示比较
区域内的像素的灰度等级;
根据确定出的各第一灰度信息和各第二灰度信息,确定字符描述特征;
根据所述字符描述特征,生成分类器。
14.如权利要求13所述的方法,其特征在于,分别确定所述图像集合包
\t含的各图像的第一灰度信息和第二灰度信息,包括:
获得至少一个定位信息集合;其中,单个定位信息集合包含基准区域的定
位信息和比较区域的定位信息;
根据所述至少一个定位信息集合中包含的各基准区域的定位信息,确定所
述各图像的各基准区域;
根据所述至少一个定位信息集合中包含的各比较区域的定位信息,确定所
述各图像的各比较区域;
确定分别表示所述各图像的各基准区域内的像素的灰度等级的各第一灰
度信息;
确定分别表示所述各图像的各比较区域内的像素的灰度等级的各第二灰
度信息。
15.如权利要求13或14所述的方法,其特征在于,当获得的所述至少一
个定位信息集合的数目大于等于二时,根据确定出的各第一灰度信息和各第二
灰度信息,确定字符描述特征,包括:
利用根据同一定位信息集合分别确定出的所述各图像的各...
【专利技术属性】
技术研发人员:杜志军,张宇,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。