图像识别模型的训练方法、图像识别方法及设备技术

技术编号：30172097 阅读：37 留言：0更新日期：2021-09-25 15:30

本公开提供了一种图像识别模型的训练方法、图像识别方法及设备。所述图像识别方法包括：获取待识别的图像；将待识别的图像输入第一图像识别模型，得到所述图像是否为三段式图像的预测结果、以及预测的所述图像中的内容区域的上边界位置和下边界位置；其中，三段式图像的中间段为内容区域，中间段以上以及中间段以下的部分为背景区域。以下的部分为背景区域。以下的部分为背景区域。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型的训练方法、图像识别方法及设备

[0001]本公开总体说来涉及图像
，更具体地讲，涉及一种图像识别模型的训练方法及设备、图像识别方法及设备。

技术介绍

[0002]随着电子技术的发展，用户可根据需求对图像(视频)进行各种处理，例如，用户可为拍摄得到的或从第三方获得的图像(视频)添加上下背景，以得到所需的作品。

技术实现思路

[0003]本公开的示例性实施例在于提供一种图像识别模型的训练方法、图像识别方法及设备，其能够确定图像是否为三段式图像、以及图像中的内容区域的上边界位置和下边界位置。
[0004]根据本公开实施例的第一方面，提供一种图像识别模型的训练方法，包括：获取训练样本，其中，所述训练样本包括带有标注的图像，所述标注包括：是否为三段式图像的标识、以及内容区域的上边界位置和下边界位置；将获取的训练样本输入第一图像识别模型，得到所述训练样本是否为三段式图像的预测结果、以及预测的所述训练样本中的内容区域的上边界位置和下边界位置；根据所述训练样本是否为三段式图像的预测结果与所述训练样本的标注，确定第一图像识别模型的第一损失函数；根据所述训练样本的标注、与预测的内容区域的上边界位置和下边界位置，确定第一图像识别模型的第二损失函数；通过根据第一损失函数和第二损失函数调整第一图像识别模型的模型参数，对第一图像识别模型进行训练；其中，三段式图像的中间段为内容区域，中间段以上以及中间段以下的部分为背景区域。
[0005]可选地，所述方法还包括：将获取的训练样本中的正样本或所述正...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，其特征在于，包括：获取待识别的图像；将待识别的图像输入第一图像识别模型，得到所述图像是否为三段式图像的预测结果、以及预测的所述图像中的内容区域的上边界位置和下边界位置；其中，三段式图像的中间段为内容区域，中间段以上以及中间段以下的部分为背景区域。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：将所述图像或所述图像的特征输入第二图像识别模型，得到预测的所述图像中的背景区域的背景类型。3.根据权利要求2所述的方法，其特征在于，所述图像的特征为第一图像识别模型对输入的所述图像进行特征提取所得到的特征。4.根据权利要求2所述的方法，其特征在于，背景类型包括以下类型之中的至少一项：纯色背景类型、纯色背景带有文字或图案的类型、毛玻璃背景类型、毛玻璃背景带有文字或图案的类型、上中下重复背景类型、以及其他类型，其中，上中下重复背景类型为背景区域显示的画面与内容区域显示的画面相同的类型。5.一种图像识别模型的训练方法，其特征在于，包括：获取训练样本，其中，所述训练样本包括带有标注的图像，所述标注包括：是否为三段式图像的标识、以及内容区域的上边界位置和下边界位置；将获取的训练样本输入第一图像识别模型，得到所述训练样本是否为三段式图像的预测结果、以及预测的所述训练样本中的内容区域的上边界位置和下边界位置；根据所述训练样本是否为三段式图像的预测结果与所述训练样本的标注，确定第一图像识别模型的第一损失函数；根据所述训练样本的标注、与预测的内容区域的上边界位置和下边界位置，确定第一图像识别模型的第二损失函数；通过根据第一损失函数和第二损失函数调整第一图像识别模型的模型参数，对第一图像识别模型进行训练；其中，三段式图像的中间段为内容区域，中间段以上以及中间段以下的部分为背景区域。6.一种图像识别设备，其特征在于，包括：图像获取单元，被配置为获取待识别的图像；第一预测单元，被配置为将待识别的图像输入第一图像识别模型，得到所述图像是否...

【专利技术属性】
技术研发人员：巩佳超，戴宇荣，于冰，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人