一种识别图像中的字符串的方法和装置制造方法及图纸

技术编号：15253829 阅读：78 留言：0更新日期：2017-05-02 19:30

本发明专利技术公开了一种识别图像中的字符串的方法和装置，属于计算机技术领域。所述方法包括：根据训练样本库中存储的包含有字符串的样本图像块的图像数据，并基于卷积神经网络算法，构建样本图像块的字符串识别结果对应的概率集合的表达式，概率集合的表达式由待定参数构成；基于使根据概率集合确定出的字符串识别结果为预先存储的样本图像块包含的字符串的概率最大的原则，对待定参数进行训练，得到待定参数的训练值；当获取到待识别的目标图像块时，基于卷积神经网络算法和待定参数的训练值，确定目标图像块的字符串识别结果对应的目标概率集合，根据目标概率集合，确定目标图像块的字符串识别结果。采用本发明专利技术，可以提高识别的正确率。

Method and device for identifying string in image

The invention discloses a method and a device for identifying a string in an image, which belongs to the technical field of computer. The method comprises the following steps: according to the storage of the training sample library contains the image data of image block string, and algorithm based on convolution neural network, build the sample set of expression probability image block string corresponding to the identification results, the expressions for the probability set parameters to be by the constitution; make according to the determined character string recognition probability set the maximum probability principle for the pre stored image blocks contain string based on the set of training parameters to get the parameters, the training value; when access to the target image blocks to be identified, convolutional neural network algorithm and parameter training value based on the determined results of target image block string target recognition probability the corresponding set, according to the target probability set, determine the string recognition results of target image block. By adopting the invention, the correct rate of recognition can be improved.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机
，特别涉及一种识别图像中的字符串的方法和装置。
技术介绍
人们在生产和生活中，会接触到大量的自然场景图像中的文字(可以将文字看作是字符串)，这些文字蕴含着丰富的信息，例如，文档、产品标签、车辆牌照、路标、广告牌等都包含文字，自动地获取自然场景图像中的文字信息可以帮助人们更有效地理解、应用图像，因此识别这些文字信息具有非常重要的实用价值，例如识别车辆牌照可以用于交通管理等等。目前，提取自然场景图像中的字符串时，首先检测自然场景图像中的字符串，可以将间隔满足预设阈值的字符串分别分割开来，得到包含字符串的图像块，然后识别分割得到的图像块中的字符串。识别图像块中的字符串的方法往往是：计算目标图像块与预先存储的基准图像块的匹配度，将匹配度最高的基准图像块中包含的字符串作为目标图像块的识别结果，其中，预先存储的基准图像块中包含的字符串各不相同，这样，为保证有较好的识别结果，需要存储大量的基准图像块，导致计算效率较低。针对上述问题，目前也有方法是将目标图像块中的字符串按照字符进行分割，识别分割后的单个字符，这样可以减少基准图像块的存储量。在实现本专利技术的过程中，专利技术人发现现有技术至少存在以下问题：通过将目标图像中的字符串按照字符进行分割，识别分割后的单个字符的方法过于依赖于分割的结果，然而自然场景图像中的自然场景通常比较复杂，往往不能正确的分割每个字符，即分割自然场景图像中的每个字符的正确率较低，从而，导致在图像中识别字符串的正确率较低。
技术实现思路
为了解决现有技术的问题，本专利技术实施例提供了一种识别图像中的字符串的方法和装置。所述...

【技术保护点】
一种识别图像中的字符串的方法，其特征在于，所述方法包括：根据预先存储的包含有字符串的样本图像块的图像数据，并基于卷积神经网络算法，构建所述样本图像块的字符串识别结果对应的概率集合的表达式，所述概率集合的表达式由所述卷积神经网络算法的待定参数构成，所述概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率；根据所述概率集合的表达式，基于使根据所述概率集合确定出的字符串识别结果为预先存储的所述样本图像块包含的字符串的概率最大的原则，对所述待定参数进行训练，得到所述待定参数的训练值；当获取到待识别的目标图像块时，基于所述卷积神经网络算法和所述待定参数的训练值，确定所述目标图像块的字符串识别结果对应的目标概率集合，根据所述目标概率集合，确定所述目标图像块的字符串识别结果。

【技术特征摘要】
1.一种识别图像中的字符串的方法，其特征在于，所述方法包括：根据预先存储的包含有字符串的样本图像块的图像数据，并基于卷积神经网络算法，构建所述样本图像块的字符串识别结果对应的概率集合的表达式，所述概率集合的表达式由所述卷积神经网络算法的待定参数构成，所述概率集合中包含的概率分别用于表示预设数目的字符位中任一字符位处的字符为多个预设字符中任一字符的概率；根据所述概率集合的表达式，基于使根据所述概率集合确定出的字符串识别结果为预先存储的所述样本图像块包含的字符串的概率最大的原则，对所述待定参数进行训练，得到所述待定参数的训练值；当获取到待识别的目标图像块时，基于所述卷积神经网络算法和所述待定参数的训练值，确定所述目标图像块的字符串识别结果对应的目标概率集合，根据所述目标概率集合，确定所述目标图像块的字符串识别结果。2.根据权利要求1所述的方法，其特征在于，所述根据预先存储的包含有字符串的样本图像块的图像数据，并基于卷积神经网络算法，构建所述样本图像块的字符串识别结果对应的概率集合的表达式，包括：对所述样本图像块的图像数据进行第一预设次数的卷积处理、第二预设次数的池化处理和第三预设次数的线性处理，得到对应的第一特征向量的表达式；对所述第一特征向量的表达式进行柔化处理，构建所述样本图像块的字符串识别结果对应的概率集合的表达式。3.根据权利要求1所述的方法，其特征在于，所述根据所述概率集合的表达式，基于使根据所述概率集合确定出的字符串识别结果为预先存储的所述样本图像块包含的字符串的概率最大的原则，对所述待定参数进行训练，得到所述待定参数的训练值，包括：基于所述概率集合的表达式，确定通过所述预设数目的字符位中的字符组合成预先存储的所述样本图像块包含的字符串的概率函数；将所述概率函数作为目标函数，基于使所述目标函数取值最大的原则，对所述待定参数进行训练，得到所述待定参数的训练值。4.根据权利要求3所述的方法，其特征在于，所述基于所述概率集合的表
\t达式，确定通过所述预设数目的字符位中的字符组合成预先存储的所述样本图像块包含的字符串的概率函数，包括：确定字符数目为所述预设数目且满足预设字符特征条件的字符串，所述预设字符特征条件为经过相邻重复字符合并处理和空格字符去除处理后能够得到预先存储的所述样本图像块包含的字符串；基于所述概率集合的表达式，确定每个所述字符数目为所述预设数目且满足预设字符特征条件的字符串对应的概率表达式；将确定出的各概率表达式相加得到概率函数。5.根据权利要求1所述的方法，其特征在于，所述根据所述目标概率集合，确定所述目标图像块的字符串识别结果，包括：根据所述目标概率集合，确定所述预设数目的字符位所包含的每个字符位中概率最大的预设字符，组成目标字符串；对所述目标字符串进行相邻重复字符合并处理和空格字符去除处理，得到所述目标图像块的字符串识别结果。6.根据权利要求1所述的方法，其特征在于，所述根据所述目标概率集合，确定所述目标图像块的字符串识别结果，包...

【专利技术属性】
技术研发人员：白翔，王巨宏，刘婷婷，陈伟，石葆光，姚聪，吕鹏原，
申请(专利权)人：华中科技大学，腾讯科技深圳有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人