基于5.1声道的视频片段情感判定方法、装置和计算机设备制造方法及图纸

技术编号：22390732 阅读：31 留言：0更新日期：2019-10-29 07:25

本申请涉及一种基于5.1声道的视频片段情感判定方法、视频片段情感判定装置、计算机设备和计算机可读存储介质。该视频片段情感判定方法包括：通过在视频播放过程中，获取视频的设定帧长的待判定片段的5.1声道信号；确定待判定片段的5.1声道信号的声道特征值；将声道特征值输入已训练的情感判定模型中，根据情感判定模型的判定结果确定待判定片段的情感类型；设定帧长通过训练情感判定模型确定。采用本方法能够在视频播放过程中，准确实时地检测和判定视频片段的情感类型，有助于实现在电视剧、电影、网络短视频等片段的播放过程中，对视频的不同情感场景进行音效处理或者为年龄较小的儿童观者跳过暴力等不适场景的功能。

Method, device and computer equipment of emotion judgment of video clip based on 5.1 channel

全部详细技术资料下载

【技术实现步骤摘要】
基于5.1声道的视频片段情感判定方法、装置和计算机设备
本申请涉及计算机
，特别是涉及一种基于5.1声道的视频片段情感判定方法、基于5.1声道的视频片段情感判定装置、计算机设备和计算机可读存储介质。
技术介绍
目前，对于视频的分类和检测方式较为单一，一般只能根据视频整体的风格对其进行大致的分类和检测；譬如针对电影的分类，一般分为恐怖片、警匪片、爱情片等。但一部视频通常不会只包含有一种类型的场景，例如警匪片中的枪战或者飞车镜头并不是始终贯穿整个视频，期间也可能出现恐怖或者爱情相关的片段。显然，传统的视频类型检测方式无法对视频中各个场景片段的情感类型进行准确和实时地判定，进而无法实现诸如在电影放映过程中，为儿童观影者自动跳过少儿不宜的片段等功能，且不利于电影及各种视频的检索和筛选。
技术实现思路
基于此，有必要针对上述技术问题，提供一种基于5.1声道的视频片段情感判定方法、基于5.1声道的视频片段情感判定装置、计算机设备和计算机可读存储介质。一方面，本专利技术实施例提供一种基于5.1声道的视频片段情感判定方法，所述方法包括：在视频播放过程中，获取视频的设定帧长的待判定片段的5.1声道信号；计算所述待判定片段的5.1声道信号的声道特征值；将所述声道特征值输入已训练的情感判定模型中，根据所述情感判定模型的判定结果确定所述待判定片段的情感类型；所述设定帧长通过训练所述情感判定模型确定。在其中一个实施例中，所述获取视频的设定帧长的待判定片段的5.1声道信号的步骤，包括：获取视频的设定帧长的待判定片段的中央声道信号、前置左声道信号、前置右声道信号、后置左环绕声道信号、...

【技术保护点】
1.一种基于5.1声道的视频片段情感判定方法，所述方法包括：在视频播放过程中，获取视频的设定帧长的待判定片段的5.1声道信号；确定所述待判定片段的5.1声道信号的声道特征值；将所述声道特征值输入已训练的情感判定模型中，根据所述情感判定模型的判定结果确定所述待判定片段的情感类型；所述设定帧长通过训练所述情感判定模型确定。

【技术特征摘要】
1.一种基于5.1声道的视频片段情感判定方法，所述方法包括：在视频播放过程中，获取视频的设定帧长的待判定片段的5.1声道信号；确定所述待判定片段的5.1声道信号的声道特征值；将所述声道特征值输入已训练的情感判定模型中，根据所述情感判定模型的判定结果确定所述待判定片段的情感类型；所述设定帧长通过训练所述情感判定模型确定。2.根据权利要求1所述的方法，其特征在于，所述获取视频的设定帧长的待判定片段的5.1声道信号的步骤，包括：获取视频的设定帧长的待判定片段的中央声道信号、前置左声道信号、前置右声道信号、后置左环绕声道信号、后置右环绕声道信号以及重低音声道信号中的一种或多种。3.根据权利要求1所述的方法，其特征在于，所述情感判定模型的训练步骤，包括：构建样本集；所述样本集中包含多个视频样本片段的5.1声道信号，各所述视频样本片段均对应有情感标签；对所述样本集进行筛选，得到多个共情片段；所述多个共情片段为所述样本集中具有同一情感标签的多个视频样本片段；获取多个共情帧信号；所述多个共情帧信号通过按预设帧长对所述多个共情片段的5.1声道信号进行分帧得到；构建特征训练集；所述特征训练集通过对从所述多个共情帧信号中提取的声道特征进行处理得到；将所述特征训练集输入待训练情感判定模型进行训练，根据训练结果调整所述预设帧长，并根据调整后的预设帧长重新获取多个共情帧信号和构建特征训练集，直至检测到所述待训练情感判定模型的训练结果满足预设条件，得到所述同一情感标签对应的情感判定子模型；所述设定帧长根据最后一次调整得到的预设帧长确定；根据每个情感标签对应的情感判定子模型，确定所述情感判定模型。4.根据权利要求3所述的方法，其特征在于，所述检测到所述待训练情感判定模型的训练结果满足预设条件的步骤，包括：评估从所述多个共情帧信号中提取的声道特征的复杂程度；根据所述待训练情感判定模型的训练结果，确定对所述共情片段的情感类型的判定准确率；若检测到所述复杂程度与所述判定准确率的平衡关系符合要求，则确定所述待训练情感判定模型的训练结果满足预设条件。5.根据权利要求3所述的方法，其特征在于，所述对所述样本集进行筛选，得到多个共情片段的步骤之后，所述情感判定模型的训练步骤还包括：获取共情片段5.1声道属性；所述共情片段5.1声道属性通过解析每个共情片段的不同声道的声音信号...

【专利技术属性】
技术研发人员：何穆，何欢潮，何伟峰，林志杰，唐爱林，何图，杨永恩，
申请(专利权)人：广州飞达音响股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人