视频的分类方法、装置、设备及存储介质制造方法及图纸

技术编号:30414365 阅读:26 留言:0更新日期:2021-10-24 16:16
本发明专利技术实施例提供的一种视频的分类方法、装置、设备及存储介质,获取待分类视频中的指定视频帧;所述指定视频帧为用于表明所述待分类视频的视频内容的视频帧;利用预先训练得到的识别模型,对所述指定视频帧进行识别,得到所述指定视频帧的画面类型;其中,所述识别模型为利用目标比特图像和所述目标比特图像对应的样本图像的画面类型标签训练得到的;所述目标比特图像为所述样本图像对应的多个比特图像中,冗余信息最少的比特图像;基于所得到的画面类型,获取所述待分类视频的视频类型。通过本方案可以提高视频分类的准确度。通过本方案可以提高视频分类的准确度。通过本方案可以提高视频分类的准确度。

【技术实现步骤摘要】
视频的分类方法、装置、设备及存储介质


[0001]本专利技术涉及图像识别
,特别是涉及一种视频的分类方法、装置、设备及存储介质。

技术介绍

[0002]随着技术的发展,关于视频的平台中,视频的数量呈爆发式增长,导致视频的分类往往需要处理海量数据。进行视频的分类时,视频的类型为按照视频的内容差异划分得到的类型,例如,视频的类型可以包括:影视剧、综艺、动漫以及自拍等等。对此,为了减少视频分类的人工成本以及提高分类效率,相关技术中,可以利用预先训练得到的神经网络,识别待分类视频中指定视频帧的画面类型;基于所识别的画面类型,获取待分类视频的视频类型。其中,神经网络模型为利用样本图像和样本图像的画面类型标签训练得到的。
[0003]但是,由于样本图像中存在冗余信息,且处于训练阶段的神经网络提取样本图像中的信息相当于无法控制的黑匣子,因此,造成处于训练阶段的神经网络容易提取样本图像中的冗余信息。相应的,训练得到的神经网络也提取视频帧中的冗余信息;并且,冗余信息为图像中与画面类型的相关度相对而言较低的信息。因此,提取的冗余信息容易导致训练得到的神经网络模型对视频帧的画面类型的识别准确度降低。举例而言,训练得到的神经网络识别人脸图像时,人像的毛孔特征为冗余信息。并且,人脸图像中人像的毛孔可能因像素以及亮度等因素存在差异,此时,训练得到的神经网络很可能因提取人脸图像中的毛孔特征这一冗余信息,造成对人脸图像的误识别,得出某一人物的人脸图像不是该人物的识别结果。相应的,对指定视频帧的画面类型的识别准确度的降低,导致视频的分类不够准确。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种视频的分类方法、装置、设备及存储介质,以实现提高视频分类的准确度的效果。具体技术方案如下:
[0005]第一方面,本专利技术实施例提供了一种视频的分类方法,该方法包括:
[0006]获取待分类视频中的指定视频帧;所述指定视频帧为用于表明所述待分类视频的视频内容的视频帧;
[0007]利用预先训练得到的识别模型,对所述指定视频帧进行识别,得到所述指定视频帧的画面类型;其中,所述识别模型为利用目标比特图像和所述目标比特图像对应的样本图像的画面类型标签训练得到的;所述目标比特图像为所述样本图像对应的多个比特图像中,冗余信息最少的比特图像;
[0008]基于所得到的画面类型,获取所述待分类视频的视频类型。
[0009]可选的,所述识别模型采用如下步骤训练得到:
[0010]获取样本图像对应的多个比特图像,并选择所述多个比特图像中冗余信息最少的比特图像,作为目标比特图像;
[0011]将所述目标比特图像输入至神经网络模型,得到所述目标比特图像对应的样本图像的预测画面类型;
[0012]基于所述预测画面类型、所述目标比特图像对应的样本图像的画面类型标签以及预设的损失函数,判断处于当前训练阶段的神经网络模型是否收敛;
[0013]如果收敛,将处于当前训练阶段的神经网络模型作为所述识别模型;
[0014]如果不收敛,调整处于当前训练阶段的神经网络模型的模型参数,得到调整后的神经网络模型;将所述目标比特图像输入所述调整后的神经网络模型,并重复上述判断和调整所述模型参数的步骤,直至所调整后的神经网络模型收敛。
[0015]可选的,所述获取样本图像对应的多个比特图像,并选择所述多个比特图像中冗余信息最少的比特图像,作为目标比特图像,包括:
[0016]对所述样本图像进行颜色通道分离,分别得到R通道、G通道以及B通道的单通道图像;
[0017]分别对各单通道图像进行比特平面分层,得到所述样本图像对应的多个比特图像;
[0018]从所述多个候选比特图像中选择纹理信息,和/或,边缘信息满足预设非冗余条件的比特图像,作为冗余信息最少的目标比特图像。
[0019]可选的,所述分别对各单通道图像进行比特平面分层,得到所述样本图像对应的多个比特图像,包括:
[0020]针对各单通道图像,将该单通道图像中每个像素点的像素值转换为八位的二进制数值;
[0021]针对各单通道图像,分别利用该单通道图像中各像素点的所述八位的二进制数值中的每一位数值,获得该单通道图像对应的八个比特图像。
[0022]可选的,所述基于所得到的画面类型,获取所述待分类视频的视频类型,包括:
[0023]从预存的画面类型与视频类型的对应关系中,查找所得到的画面类型对应的视频类型;
[0024]将所查找到的视频类型作为所述待分类视频的视频类型。
[0025]第二方面,本专利技术实施例提供了一种视频的分类装置,该装置包括:
[0026]指定视频帧获取模块,用于获取待分类视频中的指定视频帧;所述指定视频帧为用于表明所述待分类视频的视频内容的视频帧;
[0027]画面类型识别模块,用于利用预先训练得到的识别模型,对所述指定视频帧进行识别,得到所述指定视频帧的画面类型;其中,所述识别模型为利用目标比特图像和所述目标比特图像对应的样本图像的画面类型标签训练得到的;所述目标比特图像为所述样本图像对应的多个比特图像中,冗余信息最少的比特图像;
[0028]视频类型获取模块,用于基于所得到的画面类型,获取所述待分类视频的视频类型。
[0029]可选的,所述识别模型由训练装置训练得到;所述训练装置包括:
[0030]目标比特图像获取模块,用于获取样本图像对应的多个比特图像,并选择所述多个比特图像中冗余信息最少的比特图像,作为目标比特图像;
[0031]预测数据获取模块,用于将所述目标比特图像输入至神经网络模型,得到所述目
标比特图像对应的样本图像的预测画面类型;
[0032]模型参数调整模块,用于基于所述预测画面类型、所述目标比特图像对应的样本图像的画面类型标签以及预设的损失函数,判断处于当前训练阶段的神经网络模型是否收敛;如果不收敛,调整处于当前训练阶段的神经网络模型的模型参数,得到调整后的神经网络模型;将所述目标比特图像输入所述调整后的神经网络模型,并重复上述判断和调整所述模型参数的步骤,直至所调整后的神经网络模型收敛;
[0033]模型确定模块,用于在模型参数调整模块确定处于当前训练阶段的神经网络模型收敛时,将处于当前训练阶段的神经网络模型作为所述识别模型。
[0034]可选的,所述目标比特图像获取模块,具体用于:
[0035]对所述样本图像进行颜色通道分离,分别得到R通道、G通道以及B通道的单通道图像;
[0036]分别对各单通道图像进行比特平面分层,得到所述样本图像对应的多个比特图像;
[0037]从所述多个候选比特图像中选择纹理信息,和/或,边缘信息满足预设非冗余条件的比特图像,作为冗余信息最少的目标比特图像。
[0038]可选的,所述目标比特图像获取模块,具体用于:
[0039]针对各单通道图像,将该单通道图像中每个像素点的像素值转换为八位的二进制数值;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频的分类方法,其特征在于,所述方法包括:获取待分类视频中的指定视频帧;所述指定视频帧为用于表明所述待分类视频的视频内容的视频帧;利用预先训练得到的识别模型,对所述指定视频帧进行识别,得到所述指定视频帧的画面类型;其中,所述识别模型为利用目标比特图像和所述目标比特图像对应的样本图像的画面类型标签训练得到的;所述目标比特图像为所述样本图像对应的多个比特图像中,冗余信息最少的比特图像;基于所得到的画面类型,获取所述待分类视频的视频类型。2.根据权利要求1所述的方法,其特征在于,所述识别模型采用如下步骤训练得到:获取样本图像对应的多个比特图像,并选择所述多个比特图像中冗余信息最少的比特图像,作为目标比特图像;将所述目标比特图像输入至神经网络模型,得到所述目标比特图像对应的样本图像的预测画面类型;基于所述预测画面类型、所述目标比特图像对应的样本图像的画面类型标签以及预设的损失函数,判断处于当前训练阶段的神经网络模型是否收敛;如果收敛,将处于当前训练阶段的神经网络模型作为所述识别模型;如果不收敛,调整处于当前训练阶段的神经网络模型的模型参数,得到调整后的神经网络模型;将所述目标比特图像输入至所述调整后的神经网络模型,并重复上述判断和调整所述模型参数的步骤,直至所调整后的神经网络模型收敛。3.根据权利要求2所述的方法,其特征在于,所述获取样本图像对应的多个比特图像,并选择所述多个比特图像中冗余信息最少的比特图像,作为目标比特图像,包括:对所述样本图像进行颜色通道分离,分别得到R通道、G通道以及B通道的单通道图像;分别对各单通道图像进行比特平面分层,得到所述样本图像对应的多个比特图像;从所述多个候选比特图像中选择纹理信息,和/或,边缘信息满足预设非冗余条件的比特图像,作为冗余信息最少的目标比特图像。4.根据权利要求3所述的方法,其特征在于,所述分别对各单通道图像进行比特平面分层,得到所述样本图像对应的多个比特图像,包括:针对各单通道图像,将该单通道图像中每个像素点的像素值转换为八位的二进制数值;针对各单通道图像,分别利用该单通道图像中各像素点的所述八位的二进制数值中的每一位数值,获得该单通道图像对应的八个比特图像。5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所得到的画面类型,获取所述待分类视频的视频类型,包括:从预存的画面类型与视频类型的对应关系中,查找所得到的画面类型对应的视频类型;将所查找到的视频类型作为所述待分类视频的视频类型。6.一种视频的分类装置,其特征在于,所述装置包括:指定视频帧获取模块,用于获取待分类视频中的指定视频帧;所述指定视频帧为用于表明所述待分类视频的视频内容的视频帧;
画面类型识别模块,用于利用预先训练得到的识别模型,对所述指定视频...

【专利技术属性】
技术研发人员:李虎
申请(专利权)人:北京金山云网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1