一种识别图像中的字符串的方法和装置制造方法及图纸

技术编号:15253829 阅读:78 留言:0更新日期:2017-05-02 19:30
本发明专利技术公开了一种识别图像中的字符串的方法和装置,属于计算机技术领域。所述方法包括:根据训练样本库中存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建样本图像块的字符串识别结果对应的概率集合的表达式,概率集合的表达式由待定参数构成;基于使根据概率集合确定出的字符串识别结果为预先存储的样本图像块包含的字符串的概率最大的原则,对待定参数进行训练,得到待定参数的训练值;当获取到待识别的目标图像块时,基于卷积神经网络算法和待定参数的训练值,确定目标图像块的字符串识别结果对应的目标概率集合,根据目标概率集合,确定目标图像块的字符串识别结果。采用本发明专利技术,可以提高识别的正确率。

Method and device for identifying string in image

The invention discloses a method and a device for identifying a string in an image, which belongs to the technical field of computer. The method comprises the following steps: according to the storage of the training sample library contains the image data of image block string, and algorithm based on convolution neural network, build the sample set of expression probability image block string corresponding to the identification results, the expressions for the probability set parameters to be by the constitution; make according to the determined character string recognition probability set the maximum probability principle for the pre stored image blocks contain string based on the set of training parameters to get the parameters, the training value; when access to the target image blocks to be identified, convolutional neural network algorithm and parameter training value based on the determined results of target image block string target recognition probability the corresponding set, according to the target probability set, determine the string recognition results of target image block. By adopting the invention, the correct rate of recognition can be improved.

【技术实现步骤摘要】

本专利技术涉及计算机
,特别涉及一种识别图像中的字符串的方法和装置。
技术介绍
人们在生产和生活中,会接触到大量的自然场景图像中的文字(可以将文字看作是字符串),这些文字蕴含着丰富的信息,例如,文档、产品标签、车辆牌照、路标、广告牌等都包含文字,自动地获取自然场景图像中的文字信息可以帮助人们更有效地理解、应用图像,因此识别这些文字信息具有非常重要的实用价值,例如识别车辆牌照可以用于交通管理等等。目前,提取自然场景图像中的字符串时,首先检测自然场景图像中的字符串,可以将间隔满足预设阈值的字符串分别分割开来,得到包含字符串的图像块,然后识别分割得到的图像块中的字符串。识别图像块中的字符串的方法往往是:计算目标图像块与预先存储的基准图像块的匹配度,将匹配度最高的基准图像块中包含的字符串作为目标图像块的识别结果,其中,预先存储的基准图像块中包含的字符串各不相同,这样,为保证有较好的识别结果,需要存储大量的基准图像块,导致计算效率较低。针对上述问题,目前也有方法是将目标图像块中的字符串按照字符进行分割,识别分割后的单个字符,这样可以减少基准图像块的存储量。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:通过将目标图像中的字符串按照字符进行分割,识别分割后的单个字符的方法过于依赖于分割的结果,然而自然场景图像中的自然场景通常比较复杂,往往不能正确的分割每个字符,即分割自然场景图像中的每个字符的正确率较低,从而,导致在图像中识别字符串的正确率较低。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种识别图像中的字符串的方法和装置。所述技术方案如下:第一方面,提供了一种识别图像中的字符串的方法,所述方法包括:根据预先存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建所述样本图像块的字符串识别结果对应的概率集合的表达式,所述概率集合的表达式由所述卷积神经网络算法的待定参数构成,所述概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率;根据所述概率集合的表达式,基于使根据所述概率集合确定出的字符串识别结果为预先存储的所述样本图像块包含的字符串的概率最大的原则,对所述待定参数进行训练,得到所述待定参数的训练值;当获取到待识别的目标图像块时,基于所述卷积神经网络算法和所述待定参数的训练值,确定所述目标图像块的字符串识别结果对应的目标概率集合,根据所述目标概率集合,确定所述目标图像块的字符串识别结果。第二方面,提供了一种识别图像中的字符串的装置,所述装置包括:构建模块,用于根据预先存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建所述样本图像块的字符串识别结果对应的概率集合的表达式,所述概率集合的表达式由所述卷积神经网络算法的待定参数构成,所述概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率;训练模块,用于根据所述概率集合的表达式,基于使根据所述概率集合确定出的字符串识别结果为预先存储的所述样本图像块包含的字符串的概率最大的原则,对所述待定参数进行训练,得到所述待定参数的训练值;确定模块,用于当获取到待识别的目标图像块时,基于所述卷积神经网络算法和所述待定参数的训练值,确定所述目标图像块的字符串识别结果对应的目标概率集合,根据所述目标概率集合,确定所述目标图像块的字符串识别结果。本专利技术实施例提供的技术方案带来的有益效果是:本专利技术实施例中,根据训练样本库中存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建样本图像块的字符串识别结果对应的概率集合的表达式,概率集合的表达式由卷积神经网络算法的待定参数构成,概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率,根据概率集合的表达式,基于使根据概率集合确定出的字符串识别结果为预先存储的样本图像块包含的字符串的概率最大的原则,对待定参数进行训练,得到待定参数的训练值,当获取到待识别的目标图像块时,基于卷积神经网络算法和待定参数的训练值,确定目标图像块的字符串识别结果对应的目标概率集合,根据目标概率集合,确定目标图像块的字符串识别结果。这样,可以直接识别目标图像块中的字符串,无需先将字符串中的每个字符分割,再识别分割后的单个字符,即识别结果不再依赖于分割的结果,从而,可以提高识别的正确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种识别图像中的字符串的方法的流程图;图2是本专利技术实施例提供的一种确定字符串的示意图;图3是本专利技术实施例提供的一种识别图像中的字符串的装置结构示意图;图4是本专利技术实施例提供的一种识别图像中的字符串的装置结构示意图;图5是本专利技术实施例提供的一种识别图像中的字符串的装置结构示意图;图6是本专利技术实施例提供的一种识别图像中的字符串的装置结构示意图;图7是本专利技术实施例提供的一种识别图像中的字符串的装置结构示意图;图8是本专利技术实施例提供的一种服务器的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。实施例一本专利技术实施例提供了一种识别图像中的字符串的方法,如图1所示,该方法的处理流程可以包括如下的步骤:步骤101,根据预先存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建样本图像块的字符串识别结果对应的概率集合的表达式,概率集合的表达式由卷积神经网络算法的待定参数构成,概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率。步骤102,根据概率集合的表达式,基于使根据概率集合确定出的字符串识别结果为预先存储的样本图像块包含的字符串的概率最大的原则,对待定参数进行训练,得到待定参数的训练值。步骤103,当获取到待识别的目标图像块时,基于卷积神经网络算法和待定参数的训练值,确定目标图像块的字符串识别结果对应的目标概率集合,根据目标概率集合,确定目标图像块的字符串识别结果。本专利技术实施例中,根据训练样本库中存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建样本图像块的字符串识别结果对应的概率集合的表达式,概率集合的表达式由卷积神经网络算法的待定参数构成,概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率,根据概率集合的表达式,基于使根据概率集合确定出的字符串识别结果为预先存储的样本图像块包含的字符串的概率最大的原则,对待定参数进行训练,得到待定参数的训练值,当获取到待识别的目标图像块时,基于卷积神经网络算法和待定参数的训练值,确定目标图像块的字符串识别结果对应的目标概率集合,根据目标概率集合,确定目标图像块的字符串识别结果。这样,可以直接识别目标图像块中的字符串,无需先将字符串中的每个字符分割,再识别分割后本文档来自技高网...

【技术保护点】
一种识别图像中的字符串的方法,其特征在于,所述方法包括:根据预先存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建所述样本图像块的字符串识别结果对应的概率集合的表达式,所述概率集合的表达式由所述卷积神经网络算法的待定参数构成,所述概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率;根据所述概率集合的表达式,基于使根据所述概率集合确定出的字符串识别结果为预先存储的所述样本图像块包含的字符串的概率最大的原则,对所述待定参数进行训练,得到所述待定参数的训练值;当获取到待识别的目标图像块时,基于所述卷积神经网络算法和所述待定参数的训练值,确定所述目标图像块的字符串识别结果对应的目标概率集合,根据所述目标概率集合,确定所述目标图像块的字符串识别结果。

【技术特征摘要】
1.一种识别图像中的字符串的方法,其特征在于,所述方法包括:根据预先存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建所述样本图像块的字符串识别结果对应的概率集合的表达式,所述概率集合的表达式由所述卷积神经网络算法的待定参数构成,所述概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率;根据所述概率集合的表达式,基于使根据所述概率集合确定出的字符串识别结果为预先存储的所述样本图像块包含的字符串的概率最大的原则,对所述待定参数进行训练,得到所述待定参数的训练值;当获取到待识别的目标图像块时,基于所述卷积神经网络算法和所述待定参数的训练值,确定所述目标图像块的字符串识别结果对应的目标概率集合,根据所述目标概率集合,确定所述目标图像块的字符串识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据预先存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建所述样本图像块的字符串识别结果对应的概率集合的表达式,包括:对所述样本图像块的图像数据进行第一预设次数的卷积处理、第二预设次数的池化处理和第三预设次数的线性处理,得到对应的第一特征向量的表达式;对所述第一特征向量的表达式进行柔化处理,构建所述样本图像块的字符串识别结果对应的概率集合的表达式。3.根据权利要求1所述的方法,其特征在于,所述根据所述概率集合的表达式,基于使根据所述概率集合确定出的字符串识别结果为预先存储的所述样本图像块包含的字符串的概率最大的原则,对所述待定参数进行训练,得到所述待定参数的训练值,包括:基于所述概率集合的表达式,确定通过所述预设数目的字符位中的字符组合成预先存储的所述样本图像块包含的字符串的概率函数;将所述概率函数作为目标函数,基于使所述目标函数取值最大的原则,对所述待定参数进行训练,得到所述待定参数的训练值。4.根据权利要求3所述的方法,其特征在于,所述基于所述概率集合的表
\t达式,确定通过所述预设数目的字符位中的字符组合成预先存储的所述样本图像块包含的字符串的概率函数,包括:确定字符数目为所述预设数目且满足预设字符特征条件的字符串,所述预设字符特征条件为经过相邻重复字符合并处理和空格字符去除处理后能够得到预先存储的所述样本图像块包含的字符串;基于所述概率集合的表达式,确定每个所述字符数目为所述预设数目且满足预设字符特征条件的字符串对应的概率表达式;将确定出的各概率表达式相加得到概率函数。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标概率集合,确定所述目标图像块的字符串识别结果,包括:根据所述目标概率集合,确定所述预设数目的字符位所包含的每个字符位中概率最大的预设字符,组成目标字符串;对所述目标字符串进行相邻重复字符合并处理和空格字符去除处理,得到所述目标图像块的字符串识别结果。6.根据权利要求1所述的方法,其特征在于,所述根据所述目标概率集合,确定所述目标图像块的字符串识别结果,包...

【专利技术属性】
技术研发人员:白翔王巨宏刘婷婷陈伟石葆光姚聪吕鹏原
申请(专利权)人:华中科技大学腾讯科技深圳有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1