一种文本位置确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号：36434412 阅读：38 留言：0更新日期：2023-01-20 22:47

本发明专利技术实施例公开了一种文本位置确定方法、装置、电子设备和存储介质。该方法包括：获取目标图片，其中，目标图片包括目标文本；将目标图片输入至预先训练好的文本位置确定模型，得到目标图片的目标输出信息；基于目标图片的目标输出信息确定目标文本在目标图片中的目标位置。本发明专利技术实施例的方法可以利用预先训练好的文本位置确定模型，准确的确定出目标图片中的文本特征的位置，提高了文本位置确定方法的准确率。的准确率。的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本位置确定方法、装置、电子设备和存储介质

[0001]本专利技术实施例涉及文本识别领域，尤其涉及一种文本位置确定方法、装置、电子设备和存储介质。

技术介绍

[0002]文本识别是从内容杂乱的图片中自动识别出文本信息，包括文本在图片中的位置、文本的内容等。随着人工智能的发展，文本识别、文字识别等技术得到了广泛的应用。在实际应用中，需要识别出文本的图片背景往往比较复杂，有什么都是在自然场景下拍摄的图片。由于该图片背景的复杂性，在检测文本的过程中会受到各种干扰因素的影响，例如会受到不同光照、相似背景物、文字的多样性和图像模糊等的影响，导致机器无法在图片中识别出文本的位置。
[0003]现有的在图片中识别文本位置的方法大都是基于卷积神经网络的方法，例如EAST模型，EAST模型通过全卷积网络和非极大值抑制算法筛选输出层得到文本位置。但是这种算法对于不适用于背景复杂的图片，并且由于该方法使用全卷积网络进行直接回归时生成的文本位置，导致其不能识别出图片中的长文本，降低了文本位置确定方法的准确率。

技术实现思路

[0004]本专利技术提供一种文本位置确定方法、装置、电子设备和存储介质，能够利用文本位置确定模型从背景复杂的图片中准确的确定出文本的位置，提高了文本位置确定方法的准确率。
[0005]第一方面，本专利技术实施例提供了一种文本位置确定方法，所述方法包括：
[0006]获取目标图片，其中，所述目标图片包括目标文本；
[0007]将所述目标图片输入至预先训练好的文本位置确定...

【技术保护点】

【技术特征摘要】
1.一种文本位置确定方法，其特征在于，所述方法包括：获取目标图片，其中，所述目标图片包括目标文本；将所述目标图片输入至预先训练好的文本位置确定模型，得到所述目标图片的目标输出信息；基于所述目标图片的目标输出信息确定所述目标文本在所述目标图片中的目标位置。2.根据权利要求1所述的方法，其特征在于，在所述获取目标图片之前，所述方法还包括：若所述文本位置确定模型不满足预先设置的收敛条件，则在图片样本库中提取一个样本作为当前样本；使用所述当前样本对所述文本位置确定模型进行训练，重复执行上述操作，直到所述文本位置确定模型满足所述收敛条件。3.根据权利要求2所述的方法，其特征在于，所述使用所述当前样本对所述文本位置确定模型进行训练，包括：确定所述当前样本对应的样本标签；将所述当前样本输入至所述文本位置确定模型，得到所述文本位置确定模型的输出信息；基于所述文本位置确定模型的输出信息和所述样本标签计算所述文本位置确定模型的损失函数，并基于所述损失函数对所述文本位置确定模型中的模型参数进行调整。4.根据权利要求3所述的方法，其特征在于，将所述当前样本输入至所述文本位置确定模型，得到所述文本位置确定模型的输出信息，包括：将所述当前样本输入至所述文本位置确定模型，对所述当前样本进行特征提取融合，得到所述当前样本对应的多尺度信息特征；其中，所述多尺度信息特征包括所述当前样本的图像特征和文本特征；对所述多尺度信息特征进行回归计算，得到所述文本特征在所述当前样本中的位置，并将所述位置确定为所述文本位置确定模型的输出信息。5.根据权利要求4所述的方法，其特征在于，对所述当前样本进行特征提取融合，得到所述当前样本对应的多尺度信息特征，包括：将所述当前样本输入进残差神经网络，通过所述残差神经网络对所述当前样本进行特征...

【专利技术属性】
技术研发人员：李清，肖玉莹，
申请(专利权)人：中国农业银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人