视频的场景识别方法、神经网络训练方法、服务器及介质技术

技术编号：37845261 阅读：8 留言：0更新日期：2023-06-14 22:29

本申请涉及一种视频的场景识别方法、神经网络训练方法、服务器及介质。所述方法包括：通过获取待识别图像；确定待识别图像中的多个特征向量，并将多个待识别图像的特征向量分类至第一数量个图像场景类别；图像场景类别包括对应于室内场景的多种图像场景类别和对应于室外场景的多种图像场景类别；基于各特征类别中特征向量的数量，确定待识别图像分别属于每一种图像场景类别的概率值；基于各图像场景类别的概率值，从第一数量个图像场景类别中选出第二数量个目标图像场景类别，并基于第二数量个目标图像场景类别识别目标视频为室内场景或者室外场。采用本方法能够提升对目标视频进行场景识别的准确性和鲁棒性。场景识别的准确性和鲁棒性。场景识别的准确性和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
视频的场景识别方法、神经网络训练方法、服务器及介质

[0001]本申请涉及计算机
，特别是涉及一种视频的场景识别方法、神经网络训练方法、服务器、存储介质及计算机程序产品。

技术介绍

[0002]随着互联网技术的发展，社交网络上的直播娱乐越来越火，并且主播及其环境的动态展示也受到越来越多人的喜爱，因此，对直播间中的主播所处于的动态直播场景(如，室内场景和室外场景)的识别也成为了非常热门的研究课题。
[0003]在传统的直播场景的识别方式中，一般分为两种方式，一种方式为利用主播所使用的电子设备实时向服务器发送定位消息，使得服务器根据定位消息确定主播所在的地理位置，从而确定主播所处于的动态直播场景；另一种方式是利用预设的神经网络模型对直播间中直播视频的截取图像进行相似度匹配，当预设的神经网络模型匹配到截取图像与标准图像之间的相似度大于一定值时，则服务器确定的主播所处于的动态直播场景为标准图像对应的场景。
[0004]然而，基于定位消息的直播场景的识别方式常常受到电子设备的卫星信号和实地场景的空间维度的影响，使得服务器得到的定位消息不准确和不及时，从而导致识别的直播场景不够准确；以及，基于相似度的直播场景的识别方式常常由于受到标准图像的数量和类型的限制，使得其识别的直播场景也不够准确。

技术实现思路

[0005]基于此，有必要针对上述技术问题，提供一种能够提升直播场景识别准确度的视频的场景识别方法、卷积神经网络的训练方法、视频的场景识别装置、卷积神经网络的训练装置、服务器、存储介质及计算...

【技术保护点】

【技术特征摘要】
1.一种视频的场景识别方法，其特征在于，所述方法包括：获取待识别图像，所述待识别图像为针对目标视频的至少一张图像帧；确定所述待识别图像中的多个特征向量，并将所述多个特征向量分类至第一数量个图像场景类别；所述特征向量用于表征待识别图像中各像素点的像素特征，所述图像场景类别包括对应于室内场景的多种图像场景类别和对应于室外场景的多种图像场景类别；基于各所述图像场景类别中特征向量的数量，确定所述待识别图像分别属于每一种所述图像场景类别的概率值；基于各所述图像场景类别的概率值，从所述第一数量个图像场景类别中选出第二数量个目标图像场景类别，并基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景。2.根据权利要求1所述的方法，其特征在于，所述基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景，包括：在所述第二数量个目标图像场景类别中，确定属于所述室内场景的各目标图像场景类别的第一数量占比，及确定属于所述室外场景的各目标图像场景类别的第二数量占比；基于所述第一数量占比和所述第二数量占比之间的大小关系，识别所述目标视频为所述室内场景或者所述室外场景。3.根据权利要求2所述的方法，其特征在于，所述基于所述第一数量占比和所述第二数量占比之间的大小关系，识别所述目标视频为所述室内场景或者所述室外场景，包括以下三项中的一项：响应于所述第一数量占比大于所述第二数量占比，识别所述目标视频为所述室内场景；响应于所述第一数量占比小于所述第二数量占比，识别所述目标视频为所述室外场景；响应于所述第一数量占比等于所述第二数量占比，重新执行获取所述目标视频的待识别图像的步骤，直到新的待识别图像所对应的目标图像场景类别的第一数量占比大于第二数量占比，或者第一数量占比小于第二数量占比。4.根据权利要求1所述的方法，其特征在于，所述基于所述第二数量个目标图像场景类别识别所述目标视频为所述室内场景或者所述室外场景，包括：在所述第二数量个目标图像场景类别中，确定属于所述室内场景的各目标图像场景类别的概率值和值作为第一概率值和值，及确定属于所述室外场景的各目标图像场景类别的概率值和值作为第二概率值和值；基于所述第一概率值和值与所述第二概率值和值之间的大小关系，识别所述目标视频为所述室内场景或者所述室外场景。5.根据权利要求4所述的方法，其特征在于，所述基于所述第一概率值和值与所述第二概率值和值之间的大小关系，识别所述目标视频为所述室内场景或者所述室外场景，包括以下三项中的一项：响应于所述第一概率值和值大于所述第二概率值和值，识别所述目标视频为所述室内场景；响应于所述第一概率值和值小于所述第二概率值和值，识别所述目标视频为所述室外
场景；响应于所述第一概率值和值等于所述第二概率值和值，重新执行获取所述目标视频的待识别图像的步骤，直到新的待识别图像所对应的目标图像场景类别的第一概率值和值大于第二概率值和值，或者第一概率值和值小于第二概率值和值。6.根据权利要求1所述的方法，其特征在于，所述待识别图像的数量不少于两张；所述获取待识别图像，包括：基于预设的帧数间隔，对所述目标视频进行图像抽帧，得到至少两张所述待识别图像；所述从所述第一数量个图像场景类别中选出第二数量个目标图像场景...

【专利技术属性】
技术研发人员：黄寿金，聂鑫，洪国伟，徐梦迪，董治，姜涛，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人