属性标签识别、代播事件检测方法及其装置、设备、介质制造方法及图纸

技术编号:32969094 阅读:23 留言:0更新日期:2022-04-09 11:31
本申请公开一种属性标签识别方法、代播事件检测方法及其装置、设备、介质,所述识别方法包括:获取直播视频流中的视频帧,所述直播视频流来源于媒体服务器;采用已训练至收敛的人脸识别模型识别出所述视频帧中的人脸图像;采用属性标签识别学生模型,对所述人脸图像实施属性标签预测,获得与所述人脸图像相对应的属性标签;其中,所述属性标签识别学生模型以所述媒体服务器提供的任意直播视频流中的视频帧为训练样本预先被训练至收敛状态;以所述属性标签对所述视频帧中的相应人脸图像进行标注输出。本申请能够利用网络直播平台的海量直播视频流改善属性标签识别模型的识别能力,又能利用模型的识别能力服务于例如代播行为检测等下游任务。测等下游任务。测等下游任务。

【技术实现步骤摘要】
属性标签识别、代播事件检测方法及其装置、设备、介质


[0001]本申请涉及网络直播
,尤其涉及一种属性标签识别方法、代播事件检测方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]随着大数据、深度学习的蓬勃发展,人脸属性标签识别在包括安防行业已经有了广泛的落地和应用。人脸属性众多,包括年龄、性别、颜值、发色等,目前的人脸属性标签识别方法大多是通过设计各种各样的神经网络对人脸区域进行识别,为了衡量各个类别的精度和部署开销,常常使用级联模型或者多任务训练,往往精度都很难达到预期,更无法满足工业界的需求。
[0003]基于多任务学习的卷积神经网络的人脸属性分析方法,现有的方案是通过采用多任务学习的方法对人脸图像同时进行年龄估算、性别识别和种族分类。通过对三个单任务网络分别进行训练,然后选用收敛最慢网络的权值初始化多任务网络的共享部分,随机初始化多任务网络的独立部分;接下来对多任务网络进行训练,得到多任务CNN网络模型;最后,就可以利用训练好的多任务CNN网络模型对输入的人脸图像同时进行年龄、性本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种属性标签识别方法,其特征在于,包括如下步骤:获取直播视频流中的视频帧,所述直播视频流来源于媒体服务器;采用已训练至收敛的人脸识别模型识别出所述视频帧中的人脸图像;采用属性标签识别学生模型,对所述人脸图像实施属性标签预测,获得与所述人脸图像相对应的一个或多个属性标签;其中,所述属性标签识别学生模型以所述媒体服务器提供的任意直播视频流中的视频帧为训练样本预先被训练至收敛状态,其训练过程中,以预先训练至收敛状态的属性标签识别导师模型对相同训练样本预测出属性标签,以该属性标签对所述属性标签识别学生模型实施半监督训练,所述属性标签识别导师模型事先被实施有监督训练达致收敛状态;以所述属性标签对所述视频帧中的相应人脸图像进行标注输出。2.根据权利要求1所述的属性标签识别方法,其特征在于,所述属性标签识别学生模型的训练过程,包括如下步骤:从媒体服务器输出的任意直播视频流中采集单个视频帧作为训练样本;采用已训练至收敛的人脸识别模型识别出所述视频帧中的人脸图像;采用预先训练至收敛状态的属性标签识别导师模型,对所述人脸图像实施属性标签预测,获得与所述人脸图像相对应的一个或多个属性标签,构成软标签;采用所述属性标签识别学生模型,对所述人脸图像实施属性标签预测,获得与所述人脸图像相对应的一个或多个属性标签,构成结果标签;参考所述软标签计算所述结果标签的损失值,判断该损失值是否达到预设阈值,当达到预设阈值时终止训练过程;否则,实施梯度更新,重新采集所述的训练样本对所述属性标签识别学生模型实施迭代训练。3.根据权利要求1所述的属性标签识别方法,其特征在于,所述人脸识别模型执行如下步骤:在多个卷积层中分别提取所述视频帧的多个尺度的图像特征信息;在特征金字塔网络中将多个所述的图像特征信息进行特征融合,获得相应的融合特征信息;根据所述融合特征信息提取出一个或多个边界框并映射至分类空间获得其分类结果;根据分类结果表征为有效的边界框从所述视频帧中裁剪出相应的人脸图像。4.根据权利要求1至3中任意一项所述的属性标签识别方法,其特征在于,以所述属性标签对所述视频帧中的相应人脸图像进行标注输出,包括如下步骤:针对每个预测出的人脸图像,获取其由所述人脸识别模型识别出的边界框,根据边界框确定所述人脸图像在所述视频帧中的位置信息;针对每个预测出的人脸图像,生成用于表示其所述属性标签的信息图像,所述信息图像具有透明背景;根据所述位置信息,将所述信息图像叠加到所述视频帧及其相邻视频帧的相应图像位置处实现与相应的人脸图像的位置关联标注,以使所述直播视频流被客户端设备播放时显示各个人脸图像相对应的信息图像。5.根据权利要求1至3中任意一项所述的属性标签识别方法,其特征在于,以所述属性标签对所述视频帧中的相应人脸图像进行标注输出,包括如下步骤:
针对每个预测出的人脸图像,获取其由所述人脸识别模型识别出的边界框,根据边界框确定所述人脸图像在所述视频帧中的位置信息;针对每个预测出的人脸图像,将其属性标签、位置信息,以及其相应的视频帧在直播视频流中的时间戳,封装为...

【专利技术属性】
技术研发人员:苏正航陈增海贺亮亮
申请(专利权)人:广州方硅信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1