特征提取、字符识别、引擎生成、信息确定方法及装置制造方法及图纸

技术编号:12386591 阅读:64 留言:0更新日期:2015-11-25 18:57
本申请公开了一种字符描述特征提取方法,以适用于对于灰度图像的字符描述特征提取。方法包括:获得图像;确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级;根据第一灰度信息和第二灰度信息,确定字符描述特征。本申请还公开一种字符描述特征提取装置、一种字符识别方法和相应的装置、一种字符识别引擎生成方法和相应的装置以及一种信息确定方法和相应的装置。

【技术实现步骤摘要】

本申请涉及计算机
,尤其涉及一种字符描述特征提取方法、字符识别方法、字符识别引擎生成方法、信息确定方法及装置。
技术介绍
字符识别是众多视觉创新应用的基础技术,目前,比较成熟的字符识别技术有光学字符识别(OpticalCharacterRecognition,OCR)。OCR在名片识别、证件识别和文档识别等领域都有着广泛的应用。一般来说,字符识别技术主要包括两部分内容:一部分是对样本的离线训练,另一部分是在线字符识别。其中,对于样本的离线训练的目的是建立字符识别引擎。字符识别引擎是指根据一定的策略、运用特定的计算机程序对图像进行处理,并对从图像中识别出的字符的信息进行展示的系统。一般地,建立字符识别引擎的流程如图1所示,依次包括对作为训练样本的图像的二值化处理、归一化处理、提取图像中的字符描述特征和分类器设计。其中,对作为训练样本的图像的二值化处理,是指将图像所包含的各像素的灰度值转化为特定的两个灰度值中的一个,比如转化为0或255。而在线字符识别的主要目的在于利用字符识别引擎,从输入字符识别引擎的图像中识别出字符。对应于字符识别引擎的建立方法,利用字符识别引擎进行在线字符识别的流程如图2所示,依次包括对图像的二值化处理、归一化处理、提取图像中的字符描述特征,以及利用分类器确定提取到的字符描述特征所描述字符的所属类别。由图1可以看出,现有的字符识别引擎的建立基础之一是对图像的二值化<br>处理。之所以对图像进行二值化处理,是因为现有的字符描述特征提取方法往往都是基于二值化图像实现的,当该些方法应用在灰度图像上时,有可能不能提取到合适的字符描述特征,从而会影响字符识别引擎对于字符的识别准确性。
技术实现思路
本申请实施例提供一种字符描述特征提取方法,以适用于对于灰度图像的字符描述特征提取。本申请实施例还提供一种字符描述特征提取装置,以适用于对于灰度图像的字符描述特征提取。本申请实施例还提供一种字符识别方法和相应的装置。本申请实施例还提供一种字符识别引擎生成方法和相应的装置。本申请实施例还提供一种信息确定方法及装置。本申请实施例采用下述技术方案:一种字符描述特征提取方法,包括:获得图像;确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级;根据第一灰度信息和第二灰度信息,确定字符描述特征。一种字符识别方法,包括:获得图像;确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级;根据第一灰度信息和第二灰度信息,确定字符描述特征;根据所述字符描述特征确定字符。一种字符识别引擎生成方法,包括:获得图像集合;分别确定所述图像集合包含的各图像的第一灰度信息和第二灰度信息;其中,第一灰度信息表示基准区域内的像素的灰度等级;第二灰度信息表示比较区域内的像素的灰度等级;根据确定出的各第一灰度信息和各第二灰度信息,确定字符描述特征;根据所述字符描述特征,生成分类器。一种信息确定方法,包括:获得图像;确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级。一种字符描述特征提取装置,包括:图像获得单元,用于获得图像;信息确定单元,用于确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示图像获得单元获得的所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级;特征确定单元,用于根据信息确定单元确定的第一灰度信息和第二灰度信息,确定字符描述特征。一种字符识别装置,包括:图像获得单元,用于获得图像;信息确定单元,用于确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示图像获得单元获得的所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级;特征确定单元,用于根据信息确定单元确定的第一灰度信息和第二灰度信息,确定字符描述特征;字符确定单元,用于根据特征确定单元确定的所述字符描述特征确定字符。一种字符识别引擎生成装置,包括:图像获得单元,用于获得图像集合;信息确定单元,用于分别确定图像获得单元获得的所述图像集合包含的各图像的第一灰度信息和第二灰度信息;其中,第一灰度信息表示基准区域内的像素的灰度等级;第二灰度信息表示比较区域内的像素的灰度等级;特征确定单元,用于根据信息确定单元确定出的各第一灰度信息和各第二灰度信息,确定字符描述特征;分类器生成单元,用于根据特征确定单元确定的所述字符描述特征,生成分类器。一种信息确定装置,包括:图像获得单元,用于获得图像;信息确定单元,用于确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:方案可以根据表示灰度等级的灰度信息来确定字符描述特征,而无论是从二值化图像还是灰度图像中,都可以获取到这样的灰度信息,从而该方案可以适用于对于灰度图像的字符描述特征提取。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为现有技术中建立字符识别引擎的流程示意图;图2为现有技术中利用字符识别引擎进行在线字符识别的流程示意图;图3为本申请实施例1提供的一种字符描述特征提取方法的实现流程示意图;图4a为包含字符的灰度图像的示意图;图4b为由坐标轴x和坐标轴y构成的图像坐标系的示意图;图4c为基准区域和比较区域的大小以及在图像坐标系中所在位置的示意图;图4d为基准区域、比较区域与图像的位置关系的示意图;图4e为基准区域、比较区域与字符“一”的位置关系的示意图;图4f为本申请实施例1中可使用的一种基准区域和比较区域的示意图;图4g为本申请实施例1中可使用的另一种基准区域和比较区域的示意图;图5为本申请实施例2提供的一种字符识别方法的具体流程示意图;图6为本申请实施例3提供的一种字符识别引擎生成方法的具体流程示意图;图7a为本申请实施例4提供的一种利用对票据进行扫描本文档来自技高网
...

【技术保护点】
一种字符描述特征提取方法,其特征在于,包括:获得图像;确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像素的灰度等级;根据第一灰度信息和第二灰度信息,确定字符描述特征。

【技术特征摘要】
1.一种字符描述特征提取方法,其特征在于,包括:
获得图像;
确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的
基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像
素的灰度等级;
根据第一灰度信息和第二灰度信息,确定字符描述特征。
2.如权利要求1所述的方法,其特征在于,确定第一灰度信息和第二灰
度信息,包括:
获得至少一个定位信息集合;其中,单个定位信息集合包含基准区域的定
位信息和比较区域的定位信息;
根据所述至少一个定位信息集合中包含的各基准区域的定位信息,确定所
述图像的各基准区域;
根据所述至少一个定位信息集合中包含的各比较区域的定位信息,确定所
述图像的各比较区域;
确定分别表示所述图像的各基准区域内的像素的灰度等级的各第一灰度
信息;
确定分别表示所述图像的各比较区域内的像素的灰度等级的各第二灰度
信息。
3.如权利要求1或2所述的方法,其特征在于,当获得的所述至少一个
定位信息集合的数目大于等于二时,根据第一灰度信息和第二灰度信息,确定
字符描述特征,包括:
利用根据同一定位信息集合中的各基准区域的定位信息和各比较区域的
定位信息分别确定出的第一灰度信息和第二灰度信息,确定字符描述子特征;
根据确定出的各字符描述子特征,确定字符描述子特征。
4.如权利要求3所述的方法,其特征在于,利用根据同一定位信息集合

\t中的各基准区域的定位信息和各比较区域的定位信息分别确定出的第一灰度
信息和第二灰度信息,确定字符描述子特征,包括:
利用编码算法,以及所述根据同一定位信息集合中的各基准区域的定位信
息和各比较区域的定位信息分别确定出的第一灰度信息和第二灰度信息,确定
字符描述子特征。
5.如权利要求1所述的方法,其特征在于,所述基准区域与所述比较区
域不重叠。
6.如权利要求1或5所述的方法,其特征在于,单个所述基准区域的面
积与单个所述比较区域的面积相同。
7.一种字符识别方法,其特征在于,包括:
获得图像;
确定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述图像的
基准区域内的像素的灰度等级;第二灰度信息表示所述图像的比较区域内的像
素的灰度等级;
根据第一灰度信息和第二灰度信息,确定字符描述特征;
根据所述字符描述特征确定字符。
8.如权利要求7所述的方法,其特征在于,确定第一灰度信息和第二灰
度信息,包括:
获得至少一个定位信息集合;其中,单个定位信息集合包含基准区域的定
位信息和比较区域的定位信息;
根据所述至少一个定位信息集合中包含的各基准区域的定位信息,确定所
述图像的各基准区域;
根据所述至少一个定位信息集合中包含的各比较区域的定位信息,确定所
述图像的各比较区域;
确定分别表示所述图像的各基准区域内的像素的灰度等级的各第一灰度
信息;
确定分别表示所述图像的各比较区域内的像素的灰度等级的各第二灰度
信息。
9.如权利要求7或8所述的方法,其特征在于,当获得的所述至少一个
定位信息集合的数目大于等于二时,根据第一灰度信息和第二灰度信息,确定
字符描述特征,包括:
利用根据同一定位信息集合中的各基准区域的定位信息和各比较区域的
定位信息分别确定出的第一灰度信息和第二灰度信息,确定字符描述子特征;
根据确定出的各字符描述子特征,确定字符描述子特征。
10.如权利要求9所述的方法,其特征在于,利用根据同一定位信息集合
中的各基准区域的定位信息和各定位区域的定位信息分别确定出的第一灰度
信息和第二灰度信息,确定字符描述子特征,包括:
利用编码算法,以及所述根据同一定位信息集合中的各基准区域的定位信
息和各比较区域的定位信息分别确定出的第一灰度信息和第二灰度信息,确定
字符描述子特征。
11.如权利要求7所述的方法,其特征在于,所述基准区域与所述比较区
域不重叠。
12.如权利要求7或11所述的方法,其特征在于,单个所述基准区域的
面积与单个所述比较区域的面积相同。
13.一种字符识别引擎生成方法,其特征在于,包括:
获得图像集合;
分别确定所述图像集合包含的各图像的第一灰度信息和第二灰度信息;其
中,第一灰度信息表示基准区域内的像素的灰度等级;第二灰度信息表示比较
区域内的像素的灰度等级;
根据确定出的各第一灰度信息和各第二灰度信息,确定字符描述特征;
根据所述字符描述特征,生成分类器。
14.如权利要求13所述的方法,其特征在于,分别确定所述图像集合包

\t含的各图像的第一灰度信息和第二灰度信息,包括:
获得至少一个定位信息集合;其中,单个定位信息集合包含基准区域的定
位信息和比较区域的定位信息;
根据所述至少一个定位信息集合中包含的各基准区域的定位信息,确定所
述各图像的各基准区域;
根据所述至少一个定位信息集合中包含的各比较区域的定位信息,确定所
述各图像的各比较区域;
确定分别表示所述各图像的各基准区域内的像素的灰度等级的各第一灰
度信息;
确定分别表示所述各图像的各比较区域内的像素的灰度等级的各第二灰
度信息。
15.如权利要求13或14所述的方法,其特征在于,当获得的所述至少一
个定位信息集合的数目大于等于二时,根据确定出的各第一灰度信息和各第二
灰度信息,确定字符描述特征,包括:
利用根据同一定位信息集合分别确定出的所述各图像的各...

【专利技术属性】
技术研发人员:杜志军张宇
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1