一种文字查询方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:36925595 阅读:10 留言:0更新日期:2023-03-22 18:49
本公开提供了一种文字查询方法、装置、计算机设备和存储介质,其中,该方法包括:根据从待识别的目标图片中识别出的每个文字的文字信息,确定组成目标查询词的各个文字路径;所述文字信息包括文字位置和文字尺寸;根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分;根据每个所述文字路径的所述目标得分,确定所述目标图片的查询结果;所述查询结果用于指示所述目标图片中是否存在所述目标查询词。指示所述目标图片中是否存在所述目标查询词。指示所述目标图片中是否存在所述目标查询词。

【技术实现步骤摘要】
一种文字查询方法、装置、计算机设备和存储介质


[0001]本公开涉及图像识别
,具体而言,涉及一种文字查询方法、装置、计算机设备和存储介质。

技术介绍

[0002]在图像识别领域中,通常存在查询图片中是否存在目标查询词的需求。为满足查询需求,常用的匹配方式为先利用文字识别(Optical Character Recognition,简称OCR)技术提取出图片中的文本,再利用文本重排算法将各个文本重排为一个文本字符串,最后利用匹配算法,对文本字符串进行文本匹配,以确定出图片是否存在目标查询词。
[0003]但是,针对上述匹配方式而言,不仅需要复杂的匹配步骤,还存在匹配结果不准确的问题,影响了文字查询的效果。

技术实现思路

[0004]本公开实施例至少提供一种文字查询方法、装置、计算机设备和存储介质。
[0005]第一方面,本公开实施例提供了一种文字查询方法,包括:
[0006]根据从待识别的目标图片中识别出的每个文字的文字信息,确定组成目标查询词的各个文字路径;所述文字信息包括文字位置和文字尺寸;
[0007]根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分;
[0008]根据每个所述文字路径的所述目标得分,确定所述目标图片的查询结果;所述查询结果用于指示所述目标图片中是否存在所述目标查询词。
[0009]在一种可能的实施方式中,所述根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分,包括:
[0010]根据所述文字路径中的每两个相邻目标文字的文字信息,确定相邻目标文字之间存在路径的第二置信度;
[0011]根据所述文字路径中的各个目标文字的所述第一置信度和每两个相邻目标文字对应的所述第二置信度,确定所述文字路径的第一得分;
[0012]根据所述第一得分和所述文字路径的所述偏转角度信息,确定所述文字路径的目标得分。
[0013]在一种可能的实施方式中,根据所述第一得分和所述文字路径的所述偏转角度信息,确定所述文字路径的目标得分,包括:
[0014]利用预设的得分转换规则,将所述偏转角度信息转换为第二得分;
[0015]根据所述第一得分和所述第二得分,确定所述文字路径的目标得分。
[0016]在一种可能的实施方式中,所述根据所述文字路径中的每两个相邻目标文字的文字信息,确定相邻目标文字之间存在路径的第二置信度,包括:
[0017]根据所述文字路径中的每两个相邻目标文字的文字信息中的文字尺寸,确定所述相邻目标文字之间的尺寸比例;
[0018]根据所述相邻目标文字的文字信息中的文字位置,确定所述相邻目标文字之间的文字距离;
[0019]对所述尺寸比例和所述文字距离进行归一化处理,得到所述相邻目标文字之间存在路径的所述第二置信度。
[0020]在一种可能的实施方式中,所述对所述尺寸比例和所述文字距离进行归一化处理,得到每两个相邻目标文字之间存在路径的所述第二置信度,包括:
[0021]基于相邻目标文字分别对应的文字位置和所述目标图片中的除所述相邻目标文字以外的第一文字的文字位置,确定跨文字指示结果;所述跨文字指示结果用于指示在所述目标图片中,所述文字路径中的所述相邻目标文字之间是否存在第一文字;
[0022]利用所述跨文字指示结果对应的归一化权重,对所述尺寸比例和所述文字距离进行归一化处理,得到所述相邻目标文字之间存在路径的所述第二置信度。
[0023]在一种可能的实施方式中,所述基于相邻目标文字分别对应的文字位置和所述目标图片中的除所述相邻目标文字以外的第一文字的文字位置,确定跨文字指示结果,包括:
[0024]以所述相邻目标文字中任一目标文字的文字位置为圆心、预设角度为单位区间,根据所述相邻目标文字中另一目标文字的文字位置,确定所述另一目标文字所属的目标区间;其中,各个区间分别对应的角度之和等于360度;
[0025]根据每个所述第一文字的文字位置,确定属于所述目标区间的第二文字;
[0026]在所述第二文字的文字位置在水平方向上对应的坐标位置,位于相邻目标文字分别对应的文字位置分别在水平方向上的坐标位置之间的情况下,确定所述跨文字指示结果为指示所述相邻目标文字之间存在第一文字的结果。
[0027]在一种可能的实施方式中,在所述根据从待识别的目标图片中识别出的每个文字的文字信息,确定组成目标查询词的各个文字路径之前,还包括:
[0028]获取待识别的所述目标图片;
[0029]对所述目标图片进行字符检测,确定所述目标图片中的每个文字的文本检测框;
[0030]对每个所述文本检测框进行字符识别,确定每个所述文本检测框对应的文字;
[0031]根据每个所述文本检测框的尺寸确定每个文字的文字尺寸,以及根据每个所述文本检测框的位置确定每个所述文字的文字位置。
[0032]在一种可能的实施方式中,利用预先训练好的文字查询神经网络,执行如权利要求1至7任一项所述的文字查询方法。
[0033]第二方面,本公开实施例还提供一种文字查询装置,包括:
[0034]第一确定模块,用于根据从待识别的目标图片中识别出的每个文字的文字信息,确定组成目标查询词的各个文字路径;所述文字信息包括文字位置和文字尺寸;
[0035]第二确定模块,用于根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分;
[0036]第三确定模块,用于根据每个所述文字路径的所述目标得分,确定所述目标图片的查询结果;所述查询结果用于指示所述目标图片中是否存在所述目标查询词。
[0037]第三方面,本公开可选实现方式还提供一种计算机设备,处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
[0038]第四方面,本公开可选实现方式还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
[0039]关于上述文字查询装置、计算机设备、及计算机可读存储介质的效果描述参见上述文字查询方法的说明,这里不再赘述。
[0040]本公开实施例提供的文字查询方法、装置、计算机设备和存储介质,利用目标图片中识别出的每个文字的文字信息,进行文字路径的确定,可以实现从单独的文字字符出发进行目标查询词的查询,无需基于整个文本字符串进行查询,实现了细粒度的文字查询;由于偏转角度信息能够反映目标文字之间的空本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字查询方法,其特征在于,包括:根据从待识别的目标图片中识别出的每个文字的文字信息,确定组成目标查询词的各个文字路径;所述文字信息包括文字位置和文字尺寸;根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分;根据每个所述文字路径的所述目标得分,确定所述目标图片的查询结果;所述查询结果用于指示所述目标图片中是否存在所述目标查询词。2.根据权利要求1所述的方法,其特征在于,所述根据每个所述文字路径中的各个目标文字的第一置信度、各个所述目标文字的文字信息和所述文字路径的偏转角度信息,确定所述文字路径的目标得分,包括:根据所述文字路径中的每两个相邻目标文字的文字信息,确定相邻目标文字之间存在路径的第二置信度;根据所述文字路径中的各个目标文字的所述第一置信度和每两个相邻目标文字对应的所述第二置信度,确定所述文字路径的第一得分;根据所述第一得分和所述文字路径的所述偏转角度信息,确定所述文字路径的目标得分。3.根据权利要求2所述的方法,其特征在于,根据所述第一得分和所述文字路径的所述偏转角度信息,确定所述文字路径的目标得分,包括:利用预设的得分转换规则,将所述偏转角度信息转换为第二得分;根据所述第一得分和所述第二得分,确定所述文字路径的目标得分。4.根据权利要求2所述的方法,其特征在于,所述根据所述文字路径中的每两个相邻目标文字的文字信息,确定相邻目标文字之间存在路径的第二置信度,包括:根据所述文字路径中的每两个相邻目标文字的文字信息中的文字尺寸,确定所述相邻目标文字之间的尺寸比例;根据所述相邻目标文字的文字信息中的文字位置,确定所述相邻目标文字之间的文字距离;对所述尺寸比例和所述文字距离进行归一化处理,得到所述相邻目标文字之间存在路径的所述第二置信度。5.根据权利要求4所述的方法,其特征在于,所述对所述尺寸比例和所述文字距离进行归一化处理,得到每两个相邻目标文字之间存在路径的所述第二置信度,包括:基于相邻目标文字分别对应的文字位置和所述目标图片中的除所述相邻目标文字以外的第一文字的文字位置,确定跨文字指示结果;所述跨文字指示结果用于指示在所述目标图片中,所述文字路径中的所述相邻目标文字之间是否存在第一文字;利用所述跨文字指示结果对应的归一化权重,对所述尺寸比例和所述文字距离进行归一化处理,得到所述相邻目标文字之间存在路径的所述第二置信度。6.根据权利要求5所述的方法,其特...

【专利技术属性】
技术研发人员:肖金辉周多友黄凯
申请(专利权)人:北京闪星科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1