图像识别模型的训练方法、图像识别方法及设备技术

技术编号:30172097 阅读:37 留言:0更新日期:2021-09-25 15:30
本公开提供了一种图像识别模型的训练方法、图像识别方法及设备。所述图像识别方法包括:获取待识别的图像;将待识别的图像输入第一图像识别模型,得到所述图像是否为三段式图像的预测结果、以及预测的所述图像中的内容区域的上边界位置和下边界位置;其中,三段式图像的中间段为内容区域,中间段以上以及中间段以下的部分为背景区域。以下的部分为背景区域。以下的部分为背景区域。

【技术实现步骤摘要】
图像识别模型的训练方法、图像识别方法及设备


[0001]本公开总体说来涉及图像
,更具体地讲,涉及一种图像识别模型的训练方法及设备、图像识别方法及设备。

技术介绍

[0002]随着电子技术的发展,用户可根据需求对图像(视频)进行各种处理,例如,用户可为拍摄得到的或从第三方获得的图像(视频)添加上下背景,以得到所需的作品。

技术实现思路

[0003]本公开的示例性实施例在于提供一种图像识别模型的训练方法、图像识别方法及设备,其能够确定图像是否为三段式图像、以及图像中的内容区域的上边界位置和下边界位置。
[0004]根据本公开实施例的第一方面,提供一种图像识别模型的训练方法,包括:获取训练样本,其中,所述训练样本包括带有标注的图像,所述标注包括:是否为三段式图像的标识、以及内容区域的上边界位置和下边界位置;将获取的训练样本输入第一图像识别模型,得到所述训练样本是否为三段式图像的预测结果、以及预测的所述训练样本中的内容区域的上边界位置和下边界位置;根据所述训练样本是否为三段式图像的预测结果与所述训练样本的标注,确定第一图像识别模型的第一损失函数;根据所述训练样本的标注、与预测的内容区域的上边界位置和下边界位置,确定第一图像识别模型的第二损失函数;通过根据第一损失函数和第二损失函数调整第一图像识别模型的模型参数,对第一图像识别模型进行训练;其中,三段式图像的中间段为内容区域,中间段以上以及中间段以下的部分为背景区域。
[0005]可选地,所述方法还包括:将获取的训练样本中的正样本或所述正样本的特征输入第二图像识别模型,得到预测的所述正样本的背景类型,其中,所述正样本为带有为三段式图像的标识的训练样本,所述正样本的标注还包括:用于指示所述正样本中的背景区域的类型的背景类型;根据预测的背景类型与所述正样本的标注,确定第二图像识别模型的第三损失函数;通过根据第三损失函数调整第二图像识别模型的模型参数,对第二图像识别模型进行训练。
[0006]可选地,所述正样本的特征为第一图像识别模型对输入的所述正样本进行特征提取所得到的特征。
[0007]可选地,背景类型包括以下类型之中的至少一项:纯色背景类型、纯色背景带有文字或图案的类型、毛玻璃背景类型、毛玻璃背景带有文字或图案的类型、上中下重复背景类型、以及其他类型,其中,上中下重复背景类型为背景区域显示的画面与内容区域显示的画面相同的类型。
[0008]可选地,所述方法还包括:将获取的训练样本或所述训练样本的特征输入第三图像识别模型,得到预测的所述训练样本中的内容区域的上边界位置和下边界位置;根据所
述训练样本的标注、与第三图像识别模型预测的内容区域的上边界位置和下边界位置,确定第三图像识别模型的第四损失函数;通过根据第四损失函数调整第三图像识别模型的模型参数,对第三图像识别模型进行训练;其中,第三图像识别模型预测的内容区域的上边界位置和下边界位置的精准度高于第一图像识别模型预测的内容区域的上边界位置和下边界位置。
[0009]可选地,第一图像识别模型预测的内容区域的上边界位置和下边界位置表示为:内容区域的上边界所在的像素位置与图像高度的比值、内容区域的下边界所在的像素位置与图像高度的比值;和/或,第三图像识别模型预测的内容区域的上边界位置和下边界位置表示为:用于表示图像中的每个像素处于内容区域的上下边界的概率的概率图,其中,像素对应的概率越高,越接近上边界或下边界。
[0010]根据本公开实施例的第二方面,提供一种图像识别方法,包括:获取待识别的图像;将待识别的图像输入第一图像识别模型,得到所述图像是否为三段式图像的预测结果、以及预测的所述图像中的内容区域的上边界位置和下边界位置;其中,三段式图像的中间段为内容区域,中间段以上以及中间段以下的部分为背景区域。
[0011]可选地,所述方法还包括:将所述图像或所述图像的特征输入第二图像识别模型,得到预测的所述图像中的背景区域的背景类型。
[0012]可选地,所述图像的特征为第一图像识别模型对输入的所述图像进行特征提取所得到的特征。
[0013]可选地,背景类型包括以下类型之中的至少一项:纯色背景类型、纯色背景带有文字或图案的类型、毛玻璃背景类型、毛玻璃背景带有文字或图案的类型、上中下重复背景类型、以及其他类型,其中,上中下重复背景类型为背景区域显示的画面与内容区域显示的画面相同的类型。
[0014]可选地,所述方法还包括:将所述图像或所述图像的特征输入第三图像识别模型,得到预测的所述图像中的内容区域的上边界位置和下边界位置;其中,第三图像识别模型预测的内容区域的上边界位置和下边界位置的精准度高于第一图像识别模型预测的内容区域的上边界位置和下边界位置。
[0015]可选地,第一图像识别模型预测的内容区域的上边界位置和下边界位置表示为:内容区域的上边界所在的像素位置与图像高度的比值、内容区域的下边界所在的像素位置与图像高度的比值;和/或,第三图像识别模型预测的内容区域的上边界位置和下边界位置表示为:用于表示图像中的每个像素处于内容区域的上下边界的概率的概率图,其中,像素对应的概率越高,越接近上边界或下边界。
[0016]可选地,将所述图像或所述图像的特征输入第二图像识别模型,得到预测的所述图像中的背景区域的背景类型的步骤包括:当接收到请求识别背景类型的用户指令时,将所述图像或所述图像的特征输入第二图像识别模型,得到预测的所述图像中的背景区域的背景类型;和/或,第二图像识别模型是使用如上所述的训练方法训练得到的。
[0017]可选地,将所述图像或所述图像的特征输入第三图像识别模型,得到预测的所述图像中的内容区域的上边界位置和下边界位置的步骤包括:当接收到请求精准定位内容区域边界的用户指令时,将所述图像或所述图像的特征输入第三图像识别模型,得到预测的所述图像中的内容区域的上边界位置和下边界位置;和/或,第三图像识别模型是使用如上
所述的训练方法训练得到的。
[0018]可选地,第一图像识别模型是使用如上所述的训练方法训练得到的。
[0019]可选地,所述方法还包括:根据预测的所述图像中的背景区域的背景类型,对所述图像进行评价和/或图像处理。
[0020]可选地,所述方法还包括:根据第一图像识别模型预测的所述图像中的内容区域的上边界位置和下边界位置,对所述图像进行评价和/或图像处理。
[0021]可选地,所述方法还包括:根据第三图像识别模型预测的所述图像中的内容区域的上边界位置和下边界位置,对所述图像进行评价和/或图像处理。
[0022]可选地,对所述图像进行评价的步骤包括:对所述图像的画面质量进行评价;和/或,对所述图像进行图像处理的步骤包括:对所述图像进行色彩增强处理。
[0023]根据本公开实施例的第三方面,提供一种图像识别模型的训练设备,包括:样本获取单元,被配置为获取训练样本,其中,所述训练样本包括带有标注的图像,所述标注包括:是否为三段式图像的标识、以及内容区域的上边界位置和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取待识别的图像;将待识别的图像输入第一图像识别模型,得到所述图像是否为三段式图像的预测结果、以及预测的所述图像中的内容区域的上边界位置和下边界位置;其中,三段式图像的中间段为内容区域,中间段以上以及中间段以下的部分为背景区域。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述图像或所述图像的特征输入第二图像识别模型,得到预测的所述图像中的背景区域的背景类型。3.根据权利要求2所述的方法,其特征在于,所述图像的特征为第一图像识别模型对输入的所述图像进行特征提取所得到的特征。4.根据权利要求2所述的方法,其特征在于,背景类型包括以下类型之中的至少一项:纯色背景类型、纯色背景带有文字或图案的类型、毛玻璃背景类型、毛玻璃背景带有文字或图案的类型、上中下重复背景类型、以及其他类型,其中,上中下重复背景类型为背景区域显示的画面与内容区域显示的画面相同的类型。5.一种图像识别模型的训练方法,其特征在于,包括:获取训练样本,其中,所述训练样本包括带有标注的图像,所述标注包括:是否为三段式图像的标识、以及内容区域的上边界位置和下边界位置;将获取的训练样本输入第一图像识别模型,得到所述训练样本是否为三段式图像的预测结果、以及预测的所述训练样本中的内容区域的上边界位置和下边界位置;根据所述训练样本是否为三段式图像的预测结果与所述训练样本的标注,确定第一图像识别模型的第一损失函数;根据所述训练样本的标注、与预测的内容区域的上边界位置和下边界位置,确定第一图像识别模型的第二损失函数;通过根据第一损失函数和第二损失函数调整第一图像识别模型的模型参数,对第一图像识别模型进行训练;其中,三段式图像的中间段为内容区域,中间段以上以及中间段以下的部分为背景区域。6.一种图像识别设备,其特征在于,包括:图像获取单元,被配置为获取待识别的图像;第一预测单元,被配置为将待识别的图像输入第一图像识别模型,得到所述图像是否...

【专利技术属性】
技术研发人员:巩佳超戴宇荣于冰
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1