基于5.1声道的视频片段情感判定方法、装置和计算机设备制造方法及图纸

技术编号:22390732 阅读:31 留言:0更新日期:2019-10-29 07:25
本申请涉及一种基于5.1声道的视频片段情感判定方法、视频片段情感判定装置、计算机设备和计算机可读存储介质。该视频片段情感判定方法包括:通过在视频播放过程中,获取视频的设定帧长的待判定片段的5.1声道信号;确定待判定片段的5.1声道信号的声道特征值;将声道特征值输入已训练的情感判定模型中,根据情感判定模型的判定结果确定待判定片段的情感类型;设定帧长通过训练情感判定模型确定。采用本方法能够在视频播放过程中,准确实时地检测和判定视频片段的情感类型,有助于实现在电视剧、电影、网络短视频等片段的播放过程中,对视频的不同情感场景进行音效处理或者为年龄较小的儿童观者跳过暴力等不适场景的功能。

Method, device and computer equipment of emotion judgment of video clip based on 5.1 channel

【技术实现步骤摘要】
基于5.1声道的视频片段情感判定方法、装置和计算机设备
本申请涉及计算机
,特别是涉及一种基于5.1声道的视频片段情感判定方法、基于5.1声道的视频片段情感判定装置、计算机设备和计算机可读存储介质。
技术介绍
目前,对于视频的分类和检测方式较为单一,一般只能根据视频整体的风格对其进行大致的分类和检测;譬如针对电影的分类,一般分为恐怖片、警匪片、爱情片等。但一部视频通常不会只包含有一种类型的场景,例如警匪片中的枪战或者飞车镜头并不是始终贯穿整个视频,期间也可能出现恐怖或者爱情相关的片段。显然,传统的视频类型检测方式无法对视频中各个场景片段的情感类型进行准确和实时地判定,进而无法实现诸如在电影放映过程中,为儿童观影者自动跳过少儿不宜的片段等功能,且不利于电影及各种视频的检索和筛选。
技术实现思路
基于此,有必要针对上述技术问题,提供一种基于5.1声道的视频片段情感判定方法、基于5.1声道的视频片段情感判定装置、计算机设备和计算机可读存储介质。一方面,本专利技术实施例提供一种基于5.1声道的视频片段情感判定方法,所述方法包括:在视频播放过程中,获取视频的设定帧长的待判定片段的5.1声道信号;计算所述待判定片段的5.1声道信号的声道特征值;将所述声道特征值输入已训练的情感判定模型中,根据所述情感判定模型的判定结果确定所述待判定片段的情感类型;所述设定帧长通过训练所述情感判定模型确定。在其中一个实施例中,所述获取视频的设定帧长的待判定片段的5.1声道信号的步骤,包括:获取视频的设定帧长的待判定片段的中央声道信号、前置左声道信号、前置右声道信号、后置左环绕声道信号、后置右环绕声道信号以及重低音声道信号中的一种或多种。在其中一个实施例中,所述情感判定模型的训练步骤,包括:构建样本集;所述样本集中包含多个视频样本片段的5.1声道信号,各所述视频样本片段均对应有情感标签;对所述样本集进行筛选,得到多个共情片段;所述多个共情片段为所述样本集中具有同一情感标签的多个视频样本片段;获取多个共情帧信号;所述多个共情帧信号通过按预设帧长对所述多个共情片段的5.1声道信号进行分帧得到;构建特征训练集;所述特征训练集通过对从所述多个共情帧信号中提取的声道特征进行处理得到;将所述特征训练集输入待训练情感判定模型进行训练,根据训练结果调整所述预设帧长,并根据调整后的预设帧长重新获取多个共情帧信号和构建特征训练集,直至检测到所述待训练情感判定模型的训练结果满足预设条件,得到所述同一情感标签对应的情感判定子模型;所述设定帧长根据最后一次调整得到的预设帧长确定;根据每个情感标签对应的情感判定子模型,确定所述情感判定模型。在其中一个实施例中,所述检测到所述待训练情感判定模型的训练结果满足预设条件的步骤,包括:评估从所述多个共情帧信号中提取的声道特征的复杂程度;根据所述待训练情感判定模型的训练结果,确定对所述共情片段的情感类型的判定准确率;若检测到所述复杂程度与所述判定准确率的平衡关系符合要求,则确定所述待训练情感判定模型的训练结果满足预设条件。在其中一个实施例中,所述对所述样本集进行筛选,得到多个共情片段的步骤之后,所述情感判定模型的训练步骤还包括:获取共情片段5.1声道属性;所述共情片段5.1声道属性通过解析每个共情片段的不同声道的声音信号确定;根据所述共情片段5.1声道属性,构建属性训练集;所述将所述特征训练集输入待训练情感判定模型进行训练的步骤,包括:将所述特征训练集与所述属性训练集一并输入所述待训练情感判定模型进行训练。在其中一个实施例中,所述根据所述情感判定模型的判定结果确定所述待判定片段的情感类型的步骤,包括:确定所述情感判定模型的判定结果的判定准确率;若所述判定准确率大于或等于设定的准确率阈值,则将所述情感判定模型的判定结果,确定为所述待判定片段的情感类型。再一方面,本专利技术实施例提供一种基于5.1声道的视频片段情感判定装置,所述装置包括:信号获取模块,用于在视频播放过程中,获取视频的设定帧长的待判定片段的5.1声道信号;特征确定模块,用于确定所述待判定片段的5.1声道信号的声道特征值;情感判定模块,用于将所述声道特征值输入已训练的情感判定模型中,根据所述情感判定模型的判定结果确定所述待判定片段的情感类型;所述设定帧长通过训练所述情感判定模型确定。在其中一个实施例中,所述基于5.1声道的视频片段情感判定装置还包括:情感判定模型训练模块,用于构建样本集;所述样本集中包含多个视频样本片段的5.1声道信号,各所述视频样本片段均对应有情感标签;对所述样本集进行筛选,得到多个共情片段;所述多个共情片段为所述样本集中具有同一情感标签的多个视频样本片段;获取多个共情帧信号;所述多个共情帧信号通过按预设帧长对所述多个共情片段的5.1声道信号进行分帧得到;构建特征训练集;所述特征训练集通过对从所述多个共情帧信号中提取的声道特征进行处理得到;将所述特征训练集输入待训练情感判定模型进行训练,根据训练结果调整所述预设帧长,并根据调整后的预设帧长重新获取多个共情帧信号和构建特征训练集,直至检测到所述待训练情感判定模型的训练结果满足预设条件,得到所述同一情感标签对应的情感判定子模型;所述设定帧长根据最后一次调整得到的预设帧长确定;根据每个情感标签对应的情感判定子模型,确定所述情感判定模型。再一方面,本专利技术实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现一种基于5.1声道的视频片段情感判定方法或一种视频播放方法的步骤。再一方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现一种基于5.1声道的视频片段情感判定方法或一种视频播放方法的步骤。上述技术方案中的一个技术方案具有如下优点或有益效果:通过在视频播放过程中,获取视频的待判定片段的5.1声道信号,确定待判定片段的5.1声道信号的声道特征值,并将声道特征值输入已训练的情感判定模型中,这样,根据情感判定模型的判定结果即可确定待判定片段的情感类型;该方法可在视频播放过程中,满足一定准确率的情况下实时地检测和判定视频片段的情感类型,有助于实现在电视剧、电影、网络短视频等片段的播放过程中,对视频的不同情感场景进行音效处理或者为年龄较小的儿童观者跳过暴力等不适场景的功能,该方法同样可应用于视频检索、过滤、片段删减等领域,应用范围广,实用价值高。附图说明图1为一个实施例中基于5.1声道的视频片段情感判定方法的示意性流程图;图2为一个实施例中视频播放方法的示意性流程图;图3为一个实施例中基于5.1声道的视频片段情感判定装置的示意性结构图;图4为一个实施例中视频播放装置的示意性结构图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域本文档来自技高网...

【技术保护点】
1.一种基于5.1声道的视频片段情感判定方法,所述方法包括:在视频播放过程中,获取视频的设定帧长的待判定片段的5.1声道信号;确定所述待判定片段的5.1声道信号的声道特征值;将所述声道特征值输入已训练的情感判定模型中,根据所述情感判定模型的判定结果确定所述待判定片段的情感类型;所述设定帧长通过训练所述情感判定模型确定。

【技术特征摘要】
1.一种基于5.1声道的视频片段情感判定方法,所述方法包括:在视频播放过程中,获取视频的设定帧长的待判定片段的5.1声道信号;确定所述待判定片段的5.1声道信号的声道特征值;将所述声道特征值输入已训练的情感判定模型中,根据所述情感判定模型的判定结果确定所述待判定片段的情感类型;所述设定帧长通过训练所述情感判定模型确定。2.根据权利要求1所述的方法,其特征在于,所述获取视频的设定帧长的待判定片段的5.1声道信号的步骤,包括:获取视频的设定帧长的待判定片段的中央声道信号、前置左声道信号、前置右声道信号、后置左环绕声道信号、后置右环绕声道信号以及重低音声道信号中的一种或多种。3.根据权利要求1所述的方法,其特征在于,所述情感判定模型的训练步骤,包括:构建样本集;所述样本集中包含多个视频样本片段的5.1声道信号,各所述视频样本片段均对应有情感标签;对所述样本集进行筛选,得到多个共情片段;所述多个共情片段为所述样本集中具有同一情感标签的多个视频样本片段;获取多个共情帧信号;所述多个共情帧信号通过按预设帧长对所述多个共情片段的5.1声道信号进行分帧得到;构建特征训练集;所述特征训练集通过对从所述多个共情帧信号中提取的声道特征进行处理得到;将所述特征训练集输入待训练情感判定模型进行训练,根据训练结果调整所述预设帧长,并根据调整后的预设帧长重新获取多个共情帧信号和构建特征训练集,直至检测到所述待训练情感判定模型的训练结果满足预设条件,得到所述同一情感标签对应的情感判定子模型;所述设定帧长根据最后一次调整得到的预设帧长确定;根据每个情感标签对应的情感判定子模型,确定所述情感判定模型。4.根据权利要求3所述的方法,其特征在于,所述检测到所述待训练情感判定模型的训练结果满足预设条件的步骤,包括:评估从所述多个共情帧信号中提取的声道特征的复杂程度;根据所述待训练情感判定模型的训练结果,确定对所述共情片段的情感类型的判定准确率;若检测到所述复杂程度与所述判定准确率的平衡关系符合要求,则确定所述待训练情感判定模型的训练结果满足预设条件。5.根据权利要求3所述的方法,其特征在于,所述对所述样本集进行筛选,得到多个共情片段的步骤之后,所述情感判定模型的训练步骤还包括:获取共情片段5.1声道属性;所述共情片段5.1声道属性通过解析每个共情片段的不同声道的声音信号...

【专利技术属性】
技术研发人员:何穆何欢潮何伟峰林志杰唐爱林何图杨永恩
申请(专利权)人:广州飞达音响股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1