一种文本信息提取方法、设备及存储介质技术

技术编号：28037663 阅读：30 留言：0更新日期：2021-04-09 23:20

本发明专利技术实施例公开了一种文本信息提取方法、设备及存储介质，通过获取待检测图像，确定待检测图像所对应的至少一个标准外接矩形框，其中，标准外接矩形框包含至少一个标准检测框；针对每个标准外接矩形框，根据标准外接矩形框调整预确定的检测框模板，得到预测检测框模板，并根据预测检测框模板确定各标准检测框对应的文本标识；根据各文本标识对待检测图像进行文本信息提取，解决了现有技术中对文本信息进行提取时，无法针对性的对有用信息进行提取的问题，通过检测框模板确定待检测图像中的各标准检测框的文本标识，通过文本标识实现对待检测图像中的文本信息的提取，无需对全部信息进行提取，节省了数据处理时间和资源，提高工作效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本信息提取方法、设备及存储介质
本专利技术实施例涉及图像处理技术，尤其涉及一种文本信息提取方法、设备及存储介质。
技术介绍
随着人工智能技术的发展，深度学习技术的应用场景越来越广泛，例如，语音识别、文字识别、物体识别等等，深度学习技术为人们的生产、生活提供了巨大便利。随着深度学习的深入研究，文字识别技术日趋成熟，表格文本识别应用广泛。目前的文字识别技术首先通过文本定位检测模型，检测到文字的位置，然后通过对检测结果一一进行识别，最终得到文字的信息内容。但是，针对文本中的文字信息，在实际应用中，用户可能并不需要知道或者使用全部的文字信息，所以存在其中一部分文字信息是有用的文字信息，一部分文字信息为无用的文字信息。现有的文字提取方式是对信息全部进行提取，而在文字信息中存在无用信息时，提取全部文字信息浪费时间和资源，降低工作效率。
技术实现思路
本专利技术提供一种文本信息提取方法、设备及存储介质，以实现对文本信息有针对性的提取，节省时间，提高工作效率。第一方面，本专利技术实施例提供了一种文本...

【技术保护点】
1.一种文本信息提取方法，其特征在于，包括：/n获取待检测图像，确定所述待检测图像所对应的至少一个标准外接矩形框，其中，所述标准外接矩形框包含至少一个标准检测框；/n针对每个标准外接矩形框，根据所述标准外接矩形框调整预确定的检测框模板，得到预测检测框模板，并根据所述预测检测框模板确定各所述标准检测框对应的文本标识；/n根据各所述文本标识对所述待检测图像进行文本信息提取。/n

【技术特征摘要】
1.一种文本信息提取方法，其特征在于，包括：
获取待检测图像，确定所述待检测图像所对应的至少一个标准外接矩形框，其中，所述标准外接矩形框包含至少一个标准检测框；
针对每个标准外接矩形框，根据所述标准外接矩形框调整预确定的检测框模板，得到预测检测框模板，并根据所述预测检测框模板确定各所述标准检测框对应的文本标识；
根据各所述文本标识对所述待检测图像进行文本信息提取。

2.根据权利要求1所述的方法，其特征在于，所述确定所述待检测图像所对应的至少一个标准外接矩形框，包括：
根据所述待检测图像和预训练的文本检测模型确定文本外接矩形框，所述文本外接矩形框包含至少一个文本检测框；
若所述文本外接矩形框的宽度与高度的比值不在预设阈值范围内，从预设筛选方向集合中选取至少一个预设筛选方向；
针对每个预设筛选方向，根据所述预设筛选方向和文本外接矩形框确定对应的各标准检测框；
将各所述标准检测框构成的外接矩形框确定为标准外接矩形框。

3.根据权利要求2所述的方法，其特征在于，所述根据所述待检测图像和预训练的文本检测模型确定文本外接矩形框，包括：
将所述待检测图像输入到文本检测模型中，得到所述文本检测模型输出的各文本检测框；
根据各所述文本检测框的顶点坐标中的最大横坐标、最小横坐标、最大纵坐标、最小纵坐标确定文本外接矩形框。

4.根据权利要求2所述的方法，其特征在于，所述根据所述预设筛选方向和文本外接矩形框确定对应的各标准检测框，包括：
根据所述预设筛选方向筛选所述文本外接矩形框内的文本检测框，得到至少一个目标文本框；
基于各所述目标文本框构成新的文本外接矩形框；
如果所述新的文本外接矩形框的宽度与高度比值不在预设阈值范围内，则返回执行目标文本框的确定操作；否则，将所述新的文本外接矩形框对应的各目标文本框确定为标准检测框。

5.根据权利要求1所述的方法，其特征在于，所述根据所述标准外接矩形框调整预确定的检测框模板，得到预测检测框模板，包括：
根据所述标准外接矩形框的宽度与检测框模板的宽度比值对所述检测框模板的宽度和顶点纵坐标进行缩放；
根据所述标准外接矩形框的高度与所述检测框模板的高度比值对所述检测框模板的高度和顶点横坐标进行缩放；
根据缩放后的检测框模板的宽度、高度、顶点纵坐标和顶点横坐标确定预测检测框模板。

6.根据权利要求1所述的方法，其特征在于，所述根据所述预测检测框模板确定各所述标准检测框对应的文本标识，包括：
根据所述预测检测框模板、各所述标准检测框和预设位移集合确定目标检测模板；
根据所述目标检测模板中各目标检测框的目标标识确定各标准检测框对应的文本标识。

7...

【专利技术属性】
技术研发人员：卜德飞，
申请(专利权)人：上海眼控科技股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人