图像识别模型的训练与图像识别方法、装置制造方法及图纸

技术编号：30965727 阅读：28 留言：0更新日期：2021-11-25 20:35

本公开提供了一种图像识别模型的训练与图像识别方法、装置、电子设备和可读存储介质，涉及图像处理、深度学习等人工智能技术领域。图像识别模型的训练方法包括：获取多张第一图像；根据所述多张第一图像中的标识图案，生成多张第二图像；根据所述多张第一图像与所述多张第二图像，构建图像集；使用所述图像集与预设标签对神经网络模型进行训练，得到图像识别模型。图像识别方法包括：获取待识别图像；将所述待识别图像输入图像识别模型，得到所述图像识别模型输出的预测分值；在确定所述预测分值大于目标图像阈值的情况下，确定所述待识别图像中包含标识图案。本公开能够降低图像识别模型的训练成本，提升图像识别模型的识别准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型的训练与图像识别方法、装置

[0001]本公开涉及数据处理
，尤其涉及图像处理、深度学习等人工智能
提供了一种图像识别模型的训练与图像识别方法、装置、电子设备和可读存储介质。

技术介绍

[0002]随着互联网技术的飞速发展，以及大带宽低时延的5G网络技术的逐步落地，短视频的应用场景不断扩大，海量的短视频被上传至各大互联网平台，丰富了人们的生活。
[0003]但是，短视频中可能会存在标识图案，例如特定的旗帜图案、特定的符号图案等。目前主要通过人工审核的方式来识别图像中是否存在标识图案，存在成本较高、效率较低等问题。

技术实现思路

[0004]根据本公开的第一方面，提供了一种图像识别模型的训练方法，包括：获取多张第一图像；根据所述多张第一图像中的标识图案，生成多张第二图像；根据所述多张第一图像与所述多张第二图像，构建图像集；使用所述图像集与预设标签对神经网络模型进行训练，得到图像识别模型。
[0005]根据本公开的第二方面，提供了一种图像识别方法，包括：获取待识别图像；将所述待识别图像输入图像识别模型，得到所述图像识别模型输出的预测分值；在确定所述预测分值大于目标图像阈值的情况下，确定所述待识别图像中包含标识图案。
[0006]根据本公开的第三方面，提供了一种图像识别模型的训练装置，包括：第一获取单元，用于获取多张第一图像；生成单元，用于根据所述多张第一图像中的标识图案，生成多张第二图像；构建单元，用于根据所述多张第一图像与所述多张第二图像，构建图像集；训...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法，包括：获取多张第一图像；根据所述多张第一图像中的标识图案，生成多张第二图像；根据所述多张第一图像与所述多张第二图像，构建图像集；使用所述图像集与预设标签对神经网络模型进行训练，得到图像识别模型。2.根据权利要求1所述的方法，其中，所述根据所述多张第一图像中的标识图案，生成多张第二图像包括：从所述多张第一图像中提取标识图案；将所提取的标识图案，作为前景图像；获取不包含标识图案的图像，作为背景图像；将所述前景图像与所述背景图像进行粘贴，将粘贴结果作为所述第二图像。3.根据权利要求2所述的方法，其中，所述从所述多张第一图像中提取标识图案包括：从所述多张第一图像中选取第一预设数量的第一图像；从所选取的第一图像中提取所述标识图案。4.根据权利要求2所述的方法，其中，所述将所述前景图像与所述背景图像进行粘贴包括：对所述前景图像进行第一预处理；将所述前景图像的第一预处理结果与所述背景图像进行粘贴。5.根据权利要求1所述的方法，其中，所述根据所述多张第一图像与所述多张第二图像，构建图像集包括：去除所述多张第一图像中用于生成第二图像的第一图像；从剩余的第一图像中选取第二预设数量的第一图像作为测试图像，得到测试集；按照预设比例，将未作为测试集的第一图像与所述多张第二图像划分为训练图像与验证图像，得到训练集与验证集。6.根据权利要求5所述的方法，还包括，在得到所述训练集之后，对所述训练集中的训练图像进行第二预设处理；将训练图像的第二预处理结果进行归一化处理。7.根据权利要求5所述的方法，其中，所述使用所述图像集与预设标签对神经网络模型进行训练，得到图像识别模型包括：使用所述训练集中的多张训练图像与预设标签，调整所述神经网络模型的模型参数，直至所述神经网络模型收敛；选取在训练过程中满足预设条件的神经网络模型；使用所述验证集中的多张验证图像与预设标签，在所选取的神经网络模型中确定图像识别模型；使用所述测试集中的多张测试图像与预设标签，测试所述图像识别模型的识别性能。8.根据权利要求7所述的方法，其中，所述使用所述训练集中的多张训练图像与预设标签，调整所述神经网络模型的模型参数包括：根据所述训练集中的多张训练图像，得到多张合成图像；使用所述多张合成图像与预设标签，调整所述神经网络模型的模型参数。
9.一种图像识别方法，包括：获取待识别图像；将所述待识别图像输入图像识别模型，得到所述图像识别模型输出的预测分值；在确定所述预测分值大于目标图像阈值的情况下，确定所述待识别图像中包含标识图案；其中，所述图像识别模型是根据权利要求1
‑
8中任一项所述的方法预先训练得到的。10.根据权利要求9所述的方法，其中，获取所述目标图像阈值包括：设置多个图像阈值；获取多张样本图像；将所述多张样本图像输入所述图像识别模型，得到所述图像识别模型针对每张样本图像输出的预测分值；根据所述多张样本图像的预测分值与所述多个图像阈值，得到对应每个图像阈值的召回率和/或误检率；将所述召回率和/或误检率满足预设要求的图像阈值，作为所述目标图像阈值。11.一种图像识别模型的训练装置，包括：第一获取单元，用于获取多张第一图像；生成单元，用于根据所述多张第一图像中的标识图案，生成多张第二图像；构建单元，用于根据所述多张第一图像与所述多张第二图像，构建图像集；训练单元，用于使用所述图像集与预设标签对神经网络模型进行训练，得到图像识别模型。12.根据权利要求11所述的装置，其中，所述生成单元在根据所述多张第一图像中的标识图案，生成多张第二图像时，具体执行：从所述多张第一图像中提取标识图案；将所提...

【专利技术属性】
技术研发人员：崔东林，王加明，邓天生，贠挺，于天宝，陈国庆，林赛群，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人