图片识别方法、装置、电子设备及介质制造方法及图纸

技术编号:33759041 阅读:21 留言:0更新日期:2022-06-12 14:08
本发明专利技术实施例公开了一种图片识别方法,在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别出的当前字符串及其哈希值,并将当前字符串及其哈希值存储到第一预设树形结构及第二预设树形结构中中,预测当前字符串在下一时刻的新概率值,获取扩充字符串集,根据第二预设树形结构中存储的哈希值,获取概率值最高的N个字符串并保留,并将N个字符串作为当前字符串,重复上述步骤直至完成所有采集的图像的识别,获取概率值最高的一个字符串作为最终识别结果。本发明专利技术实施例提供的图片识别方法、装置、电子设备及介质,能够有效降低针对图像进行文字识别过程存储中间字符串所需的计算量,能够有效提高存储中间字符串的效率。率。率。

【技术实现步骤摘要】
图片识别方法、装置、电子设备及介质


[0001]本专利技术实施例涉及图像处理
,尤其涉及一种图片识别方法、装置、电子设备及介质。

技术介绍

[0002]随着互联网技术的飞速发展,用户可以使用图像识别装置例如词典笔或点读笔对非母语言的文本进行翻译或者注释,提高用户的学习效率。
[0003]但是,现有技术中在针对图像进行文字识别时,需要存储中间字符串及其对应的概率值,例如需要存储a、ab、abc等字符串及概率值,如果字段相同则需要累加起来,如果字段不同则需要和其他字段一起存储起来;通常的做法是先比较两个字段的长度,如果长度不同,则这两个字段肯定不同;如果长度相同,则一个一个字符的比较,遇到不同的则说明两个字段不同,此时如果集合存储了n个字段,每个字段的比较需要O(n)的复杂度,则整个集合的比较复杂度为O(n^2);使得在针对图像进行文字识别过程中存储中间字符串所需的计算量极大,使得中间字符串存储的效率较低。

技术实现思路

[0004]本专利技术实施例提供了一种图片识别方法、装置、电子设备及介质,能够有效降低针对图像进行文字识别过程存储中间字符串所需的计算量,能够有效提高存储中间字符串的效率。
[0005]本专利技术实施例第一方面提供了一种图片识别方法,包括:
[0006]在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别出的当前字符串及其哈希值,并将所述当前字符串及其哈希值存储到第一预设树形结构中;
[0007]预测所述当前字符串在下一时刻的新概率值,将所述当前字符串的哈希值存储到第二预设树形结构中;
[0008]通过下一时刻识别出的目标字符集对所述当前字符串进行扩充,获取扩充字符串集,并将所述扩充字符串集中每个扩充字符串的概率值及哈希值存储到所述第一预设树形结构中,以及将每个扩充字符串的哈希值存储到所述第二预设树形结构中;
[0009]根据所述第二预设树形结构中存储的哈希值,从所述第一预设树形结构中获取概率值最高的N个字符串并保留,其中,N不小于1的整数;并将所述N个字符串作为当前字符串,重复上述步骤直至完成所有采集的图像的识别,获取概率值最高的一个字符串作为最终识别结果。
[0010]可选的,所述在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别出的当前字符串及其哈希值,包括:
[0011]在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别概率大于预设概率的字符组成的所述当前字符串,并获取所述当前字符串的哈希值。
[0012]可选的,所述预测所述当前字符串在下一时刻的新概率,将所述当前字符串的哈
希值存储到第二预设树形结构中,包括:
[0013]预测出所述当前字符串在下一时刻的预测字符;
[0014]获取所述当前字符串与所述预测字符的组合概率为所述新概率值,将所述当前字符串的哈希值存储到所述第二预设树形结构中,其中,所述第二预设树形结构为set结构。
[0015]可选的,所述通过下一时刻识别出的目标字符集对所述当前字符串进行扩充,获取扩充字符串集,法包括:
[0016]获取下一时刻识别出的识别概率大于所述预设概率的字符组成所述目标字符集;
[0017]将所述当前字符串与所述目标字符集中每个字符进行组合,得到组合后的所有字符串为所述扩充字符串集。
[0018]可选的,所述根据所述第二预设树形结构中存储的哈希值,从所述第一预设树形结构中获取概率值最高的N个字符串并保留,包括:
[0019]根据所述当前字符串的新概率值和每个扩充字符串的概率值,从所述第二预设树形结构中确定概率值最高的N个哈希值;
[0020]根据所述N个哈希值,从所述第一预设树形结构中确定与所述N个哈希值对应的所述N个字符串。
[0021]可选的,所述第一预设树形结构为set结构。
[0022]本专利技术实施例第二方面提供了一种图片识别装置,包括:
[0023]字符识别单元,用于在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别出的当前字符串及其哈希值,并将所述当前字符串及其哈希值存储到第一预设树形结构中;
[0024]预测单元,用于预测所述当前字符串在下一时刻的新概率值,将所述当前字符串的哈希值存储到第二预设树形结构中;
[0025]扩充单元,用于通过下一时刻识别出的目标字符集对所述当前字符串进行扩充,获取扩充字符串集,并将所述扩充字符串集中每个扩充字符串的概率值及哈希值存储到所述第一预设树形结构中,以及将每个扩充字符串的哈希值存储到所述第二预设树形结构中;
[0026]循环执行单元,用于根据所述第二预设树形结构中存储的哈希值,从所述第一预设树形结构中获取概率值最高的N个字符串并保留,其中,N不小于1的整数;并将所述N个字符串作为当前字符串,重复上述步骤直至完成所有采集的图像的识别,获取概率值最高的一个字符串作为最终识别结果。
[0027]可选的,所述字符识别单元,用于在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别概率大于预设概率的字符组成的所述当前字符串,并获取所述当前字符串的哈希值。
[0028]可选的,所述预测单元,用于预测出所述当前字符串在下一时刻的预测字符;获取所述当前字符串与所述预测字符的组合概率为所述新概率值,将所述当前字符串的哈希值存储到所述第二预设树形结构中,其中,所述第二预设树形结构为set结构。
[0029]可选的,所述扩充单元,用于获取下一时刻识别出的识别概率大于所述预设概率的字符组成所述目标字符集;将所述当前字符串与所述目标字符集中每个字符进行组合,得到组合后的所有字符串为所述扩充字符串集。
[0030]可选的,所述循环执行单元,用于根据所述当前字符串的新概率值和每个扩充字符串的概率值,从所述第二预设树形结构中确定概率值最高的N个哈希值;根据所述N个哈希值,从所述第一预设树形结构中确定与所述N个哈希值对应的所述N个字符串。
[0031]可选的,所述第一预设树形结构为set结构。
[0032]本专利技术实施例第三方面提供了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于如上述图片识别方法的步骤。
[0033]本专利技术实施例第四方面提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如上述图片识别方法的步骤。
[0034]本专利技术实施例的有益效果如下:
[0035]根据上述技术方案,在通过OCR模型对图像进行文字识别过程中,在判断某个字符串需要存储时,首选通过概率值与哈希值的映射关系,确定出需要存储的N个字符的哈希值,再根据哈希值与字符串的映射关系,根据N个字符的哈希值,确定出需要存储的N个字符;与现有技术相比,不仅不需要比较存储的字段之间的长度,也不需要在字段长度相同时逐个字符比较之后再存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图片识别方法,其特征在于,包括:在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别出的当前字符串及其哈希值,并将所述当前字符串及其哈希值存储到第一预设树形结构中;预测所述当前字符串在下一时刻的新概率值,将所述当前字符串的哈希值存储到第二预设树形结构中;通过下一时刻识别出的目标字符集对所述当前字符串进行扩充,获取扩充字符串集,并将所述扩充字符串集中每个扩充字符串的概率值及哈希值存储到所述第一预设树形结构中,以及将每个扩充字符串的哈希值存储到所述第二预设树形结构中;根据所述第二预设树形结构中存储的哈希值,从所述第一预设树形结构中获取概率值最高的N个字符串并保留,其中,N不小于1的整数;并将所述N个字符串作为当前字符串,重复上述步骤直至完成所有采集的图像的识别,获取概率值最高的一个字符串作为最终识别结果。2.如权利要求1所述的方法,其特征在于,所述在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别出的当前字符串及其哈希值,包括:在通过光学字符识别模型对采集的图像进行文字识别过程中,获取识别概率大于预设概率的字符组成的所述当前字符串,并获取所述当前字符串的哈希值。3.如权利要求2所述的方法,其特征在于,所述预测所述当前字符串在下一时刻的新概率,将所述当前字符串的哈希值存储到第二预设树形结构中,包括:预测出所述当前字符串在下一时刻的预测字符;获取所述当前字符串与所述预测字符的组合概率为所述新概率值,将所述当前字符串的哈希值存储到所述第二预设树形结构中,其中,所述第二预设树形结构为set结构。4.如权利要求1所述的方法,其特征在于,所述通过下一时刻识别出的目标字符集对所述当前字符串进行扩充,获取扩充字符串集,法包括:获取下一时刻识别出的识别概率大于所述预设概率的字符组成所述目标字符集;将所述当前字符串与所述目标字符集中每个字符进行组合,得到组合后的所有字符串为所述扩充字符串集。5.如权利要求4所述的方法,其特征在于,所述根据所述第二预设树形结构中存储的哈希值,从所述第一预设树形结构中获...

【专利技术属性】
技术研发人员:王从涛阳家俊魏远明陈伟韦涛吴军龚力朱伟基
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1