阅读顺序的确定方法及装置、电子设备及存储介质制造方法及图纸

技术编号:37419337 阅读:38 留言:0更新日期:2023-04-30 09:42
本申请提供了一种阅读顺序的确定方法及装置、电子设备及存储介质,涉及图像处理技术领域。该阅读顺序的确定方法包括:获取目标文本图像中包括的文本行集合,文本行集合中包括至少一个文本行;确定至少一个文本行各自的特征向量;基于至少一个文本行各自的特征向量,对文本行集合进行至少一次文本行解码操作,得到至少一个文本行各自的阅读排序信息;基于至少一个文本行各自的阅读排序信息,确定至少一个文本行对应的阅读顺序。通过对文本行集合中各个文本行的特征向量进行文本行解码操作,得到各个文本行的阅读排序信息,再通过该阅读排序信息确定各个文本行对应的阅读顺序,提高了所确定的文本行的阅读顺序的准确性。所确定的文本行的阅读顺序的准确性。所确定的文本行的阅读顺序的准确性。

【技术实现步骤摘要】
阅读顺序的确定方法及装置、电子设备及存储介质


[0001]本申请涉及图像处理
,具体涉及一种阅读顺序的确定方法及装置、电子设备及存储介质。

技术介绍

[0002]随着科技的发展,在文本图像中提取文本的技术的应用范围日益广泛。比如,应用在学习机中时,用户在学习机界面上对显示的题目进行解答,解答完成后,学习机会自动识别用户书写的文本的顺序进而采集用户解答的内容。
[0003]在相关技术中,通常会预先设置一个文本检测顺序,按照该文本检测顺序对文本图像中的文本进行检测,检测得到的文本的排列顺序即为阅读顺序。但是,针对版式复杂的文本图像,利用这种方式得到的阅读顺序往往会不够准确,所以如何精准地确定文本图像中文本的阅读顺序是当前亟待解决的问题。

技术实现思路

[0004]为了解决上述技术问题,提出了本申请。本申请实施例提供了一种阅读顺序的确定方法及装置、电子设备及存储介质。
[0005]第一方面,本申请一实施例提供了一种阅读顺序的确定方法,该方法包括:获取目标文本图像中包括的文本行集合,文本行集合中包括至少一个文本行;本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种阅读顺序的确定方法,其特征在于,包括:获取目标文本图像中包括的文本行集合,所述文本行集合中包括至少一个文本行;确定所述至少一个文本行各自的特征向量;基于所述至少一个文本行各自的特征向量,对所述文本行集合进行至少一次文本行解码操作,得到所述至少一个文本行各自的阅读排序信息;基于所述至少一个文本行各自的阅读排序信息,确定所述至少一个文本行对应的阅读顺序。2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个文本行各自的特征向量,对所述文本行集合进行至少一次文本行解码操作,得到所述至少一个文本行各自的阅读排序信息,包括:若当前次文本行解码操作为所述至少一次文本行解码操作中的非首次文本行解码操作,则获取所述当前次文本行解码操作对应的前一次文本行解码操作的解码结果,所述解码结果中包括前一次解码文本行以及所述前一次解码文本行的阅读排序信息;确定所述前一次解码文本行的特征向量对应的隐藏向量;基于所述隐藏向量以及所述文本行集合中包括的文本行的特征向量,进行所述当前次文本行解码操作,得到所述当前次文本行解码操作的解码结果,所述解码结果中包括当前次解码文本行以及所述当前次解码文本行的阅读排序信息。3.根据权利要求2所述的方法,其特征在于,所述基于所述隐藏向量以及所述文本行集合中包括的文本行的特征向量,进行所述当前次文本行解码操作,得到所述当前次文本行解码操作的解码结果,包括:针对所述文本行集合中包括的每个文本行,确定所述文本行的特征向量和所述隐藏向量之间的特征相似度;将特征相似度最大的文本行,确定为所述当前次解码文本行;将所述当前次解码文本行排列在所述前一次解码文本行之后,确定为所述当前次解码文本行的阅读排序信息。4.根据权利要求3所述的方法,其特征在于,所述确定所述文本行的特征向量和所述隐藏向量之间的特征相似度,包括:基于所述隐藏向量,确定所述文本行的特征向量的注意力分数;对所述注意力分数进行归一化处理,得到所述文本行的特征向量和所述隐藏向量之间的特征相似度。5.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个文...

【专利技术属性】
技术研发人员:吴嘉嘉李安妮杨争艳殷兵胡金水刘聪
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1