视频的场景识别方法、神经网络训练方法、服务器及介质技术

技术编号:37845261 阅读:8 留言:0更新日期:2023-06-14 22:29
本申请涉及一种视频的场景识别方法、神经网络训练方法、服务器及介质。所述方法包括:通过获取待识别图像;确定待识别图像中的多个特征向量,并将多个待识别图像的特征向量分类至第一数量个图像场景类别;图像场景类别包括对应于室内场景的多种图像场景类别和对应于室外场景的多种图像场景类别;基于各特征类别中特征向量的数量,确定待识别图像分别属于每一种图像场景类别的概率值;基于各图像场景类别的概率值,从第一数量个图像场景类别中选出第二数量个目标图像场景类别,并基于第二数量个目标图像场景类别识别目标视频为室内场景或者室外场。采用本方法能够提升对目标视频进行场景识别的准确性和鲁棒性。场景识别的准确性和鲁棒性。场景识别的准确性和鲁棒性。

【技术实现步骤摘要】
视频的场景识别方法、神经网络训练方法、服务器及介质


[0001]本申请涉及计算机
,特别是涉及一种视频的场景识别方法、神经网络训练方法、服务器、存储介质及计算机程序产品。

技术介绍

[0002]随着互联网技术的发展,社交网络上的直播娱乐越来越火,并且主播及其环境的动态展示也受到越来越多人的喜爱,因此,对直播间中的主播所处于的动态直播场景(如,室内场景和室外场景)的识别也成为了非常热门的研究课题。
[0003]在传统的直播场景的识别方式中,一般分为两种方式,一种方式为利用主播所使用的电子设备实时向服务器发送定位消息,使得服务器根据定位消息确定主播所在的地理位置,从而确定主播所处于的动态直播场景;另一种方式是利用预设的神经网络模型对直播间中直播视频的截取图像进行相似度匹配,当预设的神经网络模型匹配到截取图像与标准图像之间的相似度大于一定值时,则服务器确定的主播所处于的动态直播场景为标准图像对应的场景。
[0004]然而,基于定位消息的直播场景的识别方式常常受到电子设备的卫星信号和实地场景的空间维度的影响,使得服务器得到的定位消息不准确和不及时,从而导致识别的直播场景不够准确;以及,基于相似度的直播场景的识别方式常常由于受到标准图像的数量和类型的限制,使得其识别的直播场景也不够准确。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提升直播场景识别准确度的视频的场景识别方法、卷积神经网络的训练方法、视频的场景识别装置、卷积神经网络的训练装置、服务器、存储介质及计算机程序产品。
[0006]根据本公开实施例的第一方面,提供一种视频的场景识别方法,包括:
[0007]获取待识别图像,所述待识别图像为针对目标视频的至少一张图像帧;
[0008]确定所述待识别图像中的多个特征向量,并将所述多个特征向量分类至第一数量个图像场景类别;所述特征向量用于表征待识别图像中各像素点的像素特征,所述图像场景类别包括对应于室内场景的多种图像场景类别和对应于室外场景的多种图像场景类别;
[0009]基于各所述图像场景类别中特征向量的数量,确定所述待识别图像分别属于每一种所述图像场景类别的概率值;
[0010]基于各所述图像场景类别的概率值,从所述第一数量个图像场景类别中选出第二数量个目标图像场景类别,并基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景。
[0011]在一示例性实施例中,所述基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景,包括:
[0012]在所述第二数量个目标图像场景类别中,确定属于所述室内场景的各目标图像场
景类别的第一数量占比,及确定属于所述室外场景的各目标图像场景类别的第二数量占比;
[0013]基于所述第一数量占比和所述第二数量占比之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景。
[0014]在一示例性实施例中,所述基于第一数量占比和所述第二数量占比之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景,包括以下三项中的一项:
[0015]响应于所述第一数量占比大于所述第二数量占比,识别所述目标视频为所述室内场景;
[0016]响应于所述第一数量占比小于所述第二数量占比,识别所述目标视频为所述室外场景;
[0017]响应于所述第一数量占比等于所述第二数量占比,重新执行获取所述目标视频的待识别图像的步骤,直到新的待识别图像所对应的目标图像场景类别的第一数量占比大于第二数量占比,或者第一数量占比小于第二数量占比。
[0018]在一示例性实施例中,所述基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景,包括:
[0019]在所述第二数量个目标图像场景类别中,确定属于所述室内场景的各目标图像场景类别的概率值和值作为第一概率值和值,及确定属于所述室外场景的各目标图像场景类别的概率值和值作为第二概率值和值;
[0020]基于所述第一概率值和值与所述第二概率值和值之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景。
[0021]在一示例性实施例中,所述基于所述第一概率值和值与所述第二概率值和值之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景,包括以下三项中的一项:
[0022]响应于所述第一概率值和值大于所述第二概率值和值,识别所述目标视频为所述室内场景;
[0023]响应于所述第一概率值和值小于所述第二概率值和值,识别所述目标视频为所述室外场景;
[0024]响应于所述第一概率值和值等于所述第二概率值和值,重新执行获取所述目标视频的待识别图像的步骤,直到新的待识别图像所对应的目标图像场景类别的第一概率值和值大于第二概率值和值,或者第一概率值和值小于第二概率值和值。
[0025]在一示例性实施例中,所述待识别图像的数量不少于两张;所述获取待识别图像,包括:
[0026]基于预设的帧数间隔,对所述目标视频进行图像抽帧,得到至少两张所述待识别图像;
[0027]所述从所述第一数量个图像场景类别中选出第二数量个目标图像场景类别,包括:
[0028]在每一所述待识别图像所属的第一数量个图像场景类别的概率值中,选出对应概率值排在前的第二数量个目标图像场景类别。
[0029]在一示例性实施例中,所述基于所述第二数量个目标图像场景类别识别所述目标
视频为所述室内场景或者所述室外场景,包括:
[0030]在各所述待识别图像对应的第二数量个目标图像场景类别中,确定属于所述室内场景的目标图像场景类别的第一总数量占比以及第一总概率值和值,以及属于所述室外场景的目标图像场景类别的第二总数量占比以及第二总概率值和值;
[0031]基于所述第一总数量占比和所述第二总数量占比之间的大小关系,和/或所述第一总概率值和值与所述第二总概率值和值之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景。
[0032]在一示例性实施例中,所述确定所述待识别图像中的多个特征向量,并将所述多个特征向量分类至第一数量个图像场景类别,包括:
[0033]基于预训练的卷积神经网络,从所述待识别图像中提取出多个像素点对应的多个特征向量;
[0034]将各所述像素点的特征向量分别与所述第一数量个的基准向量进行匹配,并将各所述像素点的特征向量分类至满足匹配度阈值的图像场景类别;其中,每一个所述基准向量对应于一个图像场景类别。
[0035]在一示例性实施例中,所述基于各所述图像场景类别中特征向量的数量,确定所述待识别图像分别属于每一种所述图像场景类别的概率值,包括:
[0036]在每一所述图像场景类别中,基于所述图像场景类别中特征向量的数量,确定所述图像场景类别关于所述数量的指数值,所述指数值表征自然对数的底数值;
[0037]确定各所述图像场景类别之本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频的场景识别方法,其特征在于,所述方法包括:获取待识别图像,所述待识别图像为针对目标视频的至少一张图像帧;确定所述待识别图像中的多个特征向量,并将所述多个特征向量分类至第一数量个图像场景类别;所述特征向量用于表征待识别图像中各像素点的像素特征,所述图像场景类别包括对应于室内场景的多种图像场景类别和对应于室外场景的多种图像场景类别;基于各所述图像场景类别中特征向量的数量,确定所述待识别图像分别属于每一种所述图像场景类别的概率值;基于各所述图像场景类别的概率值,从所述第一数量个图像场景类别中选出第二数量个目标图像场景类别,并基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景。2.根据权利要求1所述的方法,其特征在于,所述基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景,包括:在所述第二数量个目标图像场景类别中,确定属于所述室内场景的各目标图像场景类别的第一数量占比,及确定属于所述室外场景的各目标图像场景类别的第二数量占比;基于所述第一数量占比和所述第二数量占比之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一数量占比和所述第二数量占比之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景,包括以下三项中的一项:响应于所述第一数量占比大于所述第二数量占比,识别所述目标视频为所述室内场景;响应于所述第一数量占比小于所述第二数量占比,识别所述目标视频为所述室外场景;响应于所述第一数量占比等于所述第二数量占比,重新执行获取所述目标视频的待识别图像的步骤,直到新的待识别图像所对应的目标图像场景类别的第一数量占比大于第二数量占比,或者第一数量占比小于第二数量占比。4.根据权利要求1所述的方法,其特征在于,所述基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景,包括:在所述第二数量个目标图像场景类别中,确定属于所述室内场景的各目标图像场景类别的概率值和值作为第一概率值和值,及确定属于所述室外场景的各目标图像场景类别的概率值和值作为第二概率值和值;基于所述第一概率值和值与所述第二概率值和值之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景。5.根据权利要求4所述的方法,其特征在于,所述基于所述第一概率值和值与所述第二概率值和值之间的大小关系,识别所述目标视频为所述室内场景或者所述室外场景,包括以下三项中的一项:响应于所述第一概率值和值大于所述第二概率值和值,识别所述目标视频为所述室内场景;响应于所述第一概率值和值小于所述第二概率值和值,识别所述目标视频为所述室外
场景;响应于所述第一概率值和值等于所述第二概率值和值,重新执行获取所述目标视频的待识别图像的步骤,直到新的待识别图像所对应的目标图像场景类别的第一概率值和值大于第二概率值和值,或者第一概率值和值小于第二概率值和值。6.根据权利要求1所述的方法,其特征在于,所述待识别图像的数量不少于两张;所述获取待识别图像,包括:基于预设的帧数间隔,对所述目标视频进行图像抽帧,得到至少两张所述待识别图像;所述从所述第一数量个图像场景类别中选出第二数量个目标图像场景...

【专利技术属性】
技术研发人员:黄寿金聂鑫洪国伟徐梦迪董治姜涛
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1