一种文本位置关系的匹配方法、装置、设备及存储介质制造方法及图纸

技术编号：39038648 阅读：28 留言：0更新日期：2023-10-10 11:51

本申请实施例公开了一种文本位置关系的匹配方法、装置、设备及存储介质,可用于金融领域或其他领域。在该方法中，根据预设的识别模型对目标文本图像进行识别，得到文本信息；根据文本位置计算各个文本框之间的重叠率,通过计算各文本框之间的重叠率的方式感知各个文本框之间的相互位置关系信息；若第一文本框和第二文本框之间的位置关系信息符合预设条件，则将第一文本框和第二文本框进行合并调整，得到调整后的文本信息；将调整后的文本信息输入预设的二维数组进行匹配，得到匹配结果，通过将符合条件的文本框合并，从而获得识别模型识别输出的文本位置关系，提升文本图像的识别效果。果。果。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本位置关系的匹配方法、装置、设备及存储介质

[0001]本申请涉及金融领域，尤其涉及一种文本位置关系的匹配方法、装置、设备及存储介质。

技术介绍

[0002]图像识别技术广泛应用于各个领域，在金融领域中，常常面对各类保险的多种资质证明、表单、票据的文本图像的精准识别问题。
[0003]现有技术中，通常采用光学字符识别(Optical Character Recognition，OCR)文字识别模型对文本图像进行识别，但在文本图像的处理过程中，常常出现需要识别的文本图像中存在表格形式的数据的情况，现有技术常用神经网络模型进行表格文字的提取，依赖表格边框线对文字进行提取，但是神经网络模型的训练耗时长，并且在遇到复杂的表格时，对于文本图像的文本位置关系的提取效果较差。

技术实现思路

[0004]本申请实施例提供了一种文本位置关系的匹配方法、装置、设备及存储介质，可以提高文本图像的文本位置关系的提取效果。
[0005]本申请第一方面提供了一种文本位置关系的匹配方法，包括：
[0006]根...

【技术保护点】

【技术特征摘要】
1.一种文本位置关系的匹配方法，其特征在于，所述方法包括：根据预设的识别模型对目标文本图像进行识别，得到文本信息，所述文本信息包括至少两个文本框的文本内容和文本位置；根据所述文本位置计算各个文本框之间的重叠率；根据所述重叠率确定所述各个文本框之间的位置关系信息；若第一文本框和第二文本框之间的所述位置关系信息符合预设条件，则将所述第一文本框与所述第二文本框进行合并调整，得到调整后的文本信息；将所述调整后的文本信息输入预设的二维数组进行匹配，得到匹配结果。2.根据权利要求1所述的方法，其特征在于，所述文本位置包括所述各个文本框的坐标信息，所述重叠率包括第一重叠率和第二重叠率；所述根据所述文本位置计算各个文本框之间的重叠率包括：根据所述各个文本框的坐标信息计算所述各个文本框在x轴的坐标的第一重叠率；根据所述各个文本框的坐标信息计算所述各个文本框在y轴的坐标的第二重叠率。3.根据权利要求1所述的方法，其特征在于，所述若第一文本框和第二文本框之间的所述位置关系信息符合预设条件，则将所述第一文本框与所述第二文本框进行合并调整包括：若所述第一文本框和所述第二文本框的位置关系信息为同行，则将所述第一文本框和所述第二文本框进行合并调整。4.根据权利要求3所述的方法，其特征在于，所述若第一文本框和所述第二文本框的位置关系信息为同行，则将所述第一文本框和第二文本框进行合并调整包括：若所述第一文本框和所述第二文本框的重叠率大于第一预设值，且所述第一文本框和所述第二文本框在x轴方向的距离小于或等于第二预设值，则将所述第一文本框与所述第二文本框进行合并调整。5.根据权利要求1所述的方法，其特征在于，所述将所述调整后的文本信息输入预设的二维数组进行匹配包括：将所述调整后的文本信息中同列的文本框和同行的文本框根据所述位置关系信息输入所述预设的二维数组进行匹配。6.根据权利要求4所...

【专利技术属性】
技术研发人员：凌峻，王舒远，
申请(专利权)人：中国银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人