一种图像信息的识别方法、装置及可读存储介质制造方法及图纸

技术编号：41133906 阅读：4 留言：0更新日期：2024-04-30 18:04

本申请提供一种图像信息的识别方法、装置及可读存储介质，涉及智能识别技术领域。该方法包括：获取待识别的图像；识别图像中的各个文本区域，以及每个文本区域内的文字；使用已训练的图推理模型，确定每个文本区域的类型；根据每个文本区域内的文字和类型，确定图像信息的识别结果。通过本申请提供的技术方案可以减少出现在复杂场景下提取到错误的身份证信息的情况，进而提高识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智能识别，尤其涉及一种图像信息的识别方法、装置及可读存储介质。

技术介绍

1、随着计算机技术的发展，身份证识别技术随之兴起。身份证识别技术主要是对拍摄的身份证图像进行文字识别和提取，从而确定身份证信息，例如姓名、性别、出生日期、身份证号码以及住址等。

2、但是，受拍摄姿态、拍摄环境等因素的影响，拍摄的身份证图像容易出现带有倾斜、眩光或者图像畸变等多种情况，这就导致容易提取到错误的身份证信息，降低识别的准确率。

技术实现思路

1、本申请实施例提供一种图像信息的识别方法、装置及可读存储介质，用于解决现有技术中身份证信息的识别准确率较低的问题。

2、为解决上述技术问题，本申请实施例提供如下技术方案：

3、第一方面，本申请实施例提供一种图像信息的识别方法，该方法包括：获取待识别的图像；识别图像中的各个文本区域，以及每个文本区域内的文字；使用已训练的图推理模型，确定每个文本区域的类型；根据每个文本区域内的文字，确定图像信息的识别结果。

4、在一些实施例中，识别图像中的各个文本区域，以及每个文本区域内的文字，包括：使用已训练的第一模型识别图像中的目标图像区域；使用已训练的第二模型识别目标图像区域中的文本区域；使用已训练的第三模型识别每个文本区域内的文字。

5、在一些实施例中，待识别的图像包括身份证图像，目标图像区域包括身份证图像所在的区域。

6、在一些实施例中，已训练的第一模型的训练过程包括：获取第一训练数据集，

7、在一些实施例中，已训练的图推理模型的训练过程包括：获取第二训练数据集，第二训练数据集包括每个文本区域的第一数据信息和目标图像区域的第二数据信息；其中，第一数据信息包括：文本区域的位置信息、尺寸信息以及文本区域内的文本字符串；第二数据信息包括目标图像区域的位置信息和尺寸信息；根据第一数据信息，确定每个文本区域的特征向量；根据第一数据信息和第二数据信息，确定每两个文本区域之间的边缘权重，边缘权重用于表示两个文本区域之间的空间关系；根据特征向量和边缘权重对初始的图推理模型进行训练，得到已训练的图推理模型。

8、在一些实施例中，根据第一数据信息，确定每个文本区域的特征向量的过程，包括：确定文本区域中每个文本字符串的独热one-hot编码；将文本区域中所有文本字符串的one-hot编码的编码矩阵投影到低维度空间，获得投影结果；将投影结果输入至bi-lstm模型，获得文本区域的特征向量。

9、在一些实施例中，根据第一数据信息和第二数据信息，确定每两个文本区域之间的边缘权重，包括：根据第一数据信息，确定每两个文本区域之间的第一空间关系；根据第一数据信息和第二数据信息，确定每个文本框和目标图像区域的第二空间关系；根据第一空间关系和第二空间关系，确定边缘权重。

10、在一些实施例中，第一空间关系包括：两个不相同的文本框之间的水平距离、垂直距离、相对空间位置距离、宽度比以及相对形状信息；第二空间关系包括：文本区域与目标图像区域中心点的横向距离和纵向距离；文本区域与目标图像区域的面积比；文本区域与目标图像之间的相对位置信息；文本区域与目标图像区域之间的相对位置信息及大小比例信息。

11、在一些实施例中，根据特征向量和边缘权重对初始的图推理模型进行训练，得到已训练的图推理模型，包括：根据特征向量和边缘权重确定迭代更新后的特征向量；根据迭代更新后的特征向量和预设的损失函数对初始的图推理模型进行训练，得到已训练的图推理模型。

12、第二方面，本申请实施例提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，当计算机程序在电子设备上运行时，使得电子设备执行如上述第一方面中的图像信息的识别方法。

13、第三方面，本申请实施例提供一种计算机程序产品，当计算机程序产品在电子设备上运行时，使得电子设备执行上述第一方面所述方法的步骤。

14、本申请实施例提供的图像信息的识别方法，由于在识别到图像中的各个文本区域以及每个文本区域内的文字之后，会先使用已训练的图推理模型，确定每个文本区域的类型，然后再根据每个文本区域内的文字，确定出图像信息的识别结果。由此能够减少出现在复杂场景下提取到错误的身份证信息的情况，进而提高识别准确率。

本文档来自技高网...

【技术保护点】

1.一种图像信息的识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，识别所述图像中的各个文本区域，以及每个所述文本区域内的文字，包括：

3.根据权利要求2所述的方法，其特征在于，所述图像包括身份证图像，所述目标图像区域包括所述身份证图像所在的区域。

4.根据权利要求3所述的方法，其特征在于，所述已训练的第一模型的训练过程包括：

5.根据权利要求1-4任一项所述的方法，其特征在于，所述已训练的图推理模型的训练过程包括：

6.根据权利要求5所述的方法，其特征在于，根据所述第一数据信息，确定每个所述文本区域的特征向量的过程，包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述第一数据信息和所述第二数据信息，确定每两个所述文本区域之间的边缘权重，包括：

8.根据权利要求7所述的方法，其特征在于，所述第一空间关系包括：两个不相同的文本区域之间的水平距离、垂直距离、相对空间位置距离、宽度比以及相对形状信息；

9.根据权利要求5所述的方法，其特征在于，所述根据所述特征

10.一种计算机可读存储介质，其特征在于，计算机可读存储介质存储有计算机程序，当计算机程序在电子设备上运行时，使得电子设备执行如权利要求1-9中任一项所述的方法。

...

【技术特征摘要】