一种场景识别方法及装置制造方法及图纸

技术编号:26347176 阅读:61 留言:0更新日期:2020-11-13 21:31
本申请提供了一种场景识别方法及装置,属于计算机技术领域,所述方法包括:获取待识别的目标视频;通过预设的音频处理算法、所述目标视频的音频数据、以及所述音频数据在所述目标视频中对应的播放时间戳,确定声音状态与播放时间戳的对应关系,其中,所述声音状态包括有声状态和无声状态;根据所述声音状态与播放时间戳的对应关系,确定对应的声音状态为有声状态的播放时间戳,将确定出的播放时间戳对应的场景确定为目标场景,以建立场景与播放时间戳的对应关系。采用本申请,可以提高视频显示效果。

【技术实现步骤摘要】
一种场景识别方法及装置
本申请涉及计算机
,特别是涉及一种场景识别方法及装置。
技术介绍
录播系统具有视频直播、视频点播、以及视频编辑等功能。录播系统的服务器可以通过设置在预设位置处的录像机,对目标活动进行拍摄,得到包含活动场景的视频文件,然后,服务器可以在本地存储视频文件。由此,用户可以通过客户端获取服务器中的视频文件,然后进行视频点播。例如,服务器可以通过录像机对教室中教师的讲课过程进行拍摄,得到包含教学场景的视频文件,用户可以通过客户端获取该视频文件,实现教学录播。但是,教学场景不仅包含教师授课场景,还包含学生解答习题的场景,用户在通过客户端观看视频时,仅能通过观看的方式确定某一场景是教师授课场景或学生解答习题场景,视频显示效果差。
技术实现思路
本申请实施例的目的在于提供一种场景识别方法及装置,以实现提高视频显示效果。具体技术方案如下:第一方面,提供了一种场景识别方法,所述方法包括:获取待识别的目标视频;通过预设的音频处理算法、所述目标视频的音频数据、以及所述音频数据在所述目标视频中对应的播放时间戳,确定声音状态与播放时间戳的对应关系,其中,所述声音状态包括有声状态和无声状态;根据所述声音状态与播放时间戳的对应关系,确定对应的声音状态为有声状态的播放时间戳,将确定出的播放时间戳对应的场景确定为目标场景,以建立场景与播放时间戳的对应关系。可选的,所述根据所述声音状态与播放时间戳的对应关系,确定对应的声音状态为有声状态的播放时间戳,将确定出的播放时间戳对应的场景确定为目标场景包括:在当前播放时间戳对应的声音状态为无声状态时,确定在所述当前播放时间戳之后且对应的声音状态为有声状态的最小播放时间戳,并将所述最小播放时间戳对应的场景确定为目标场景;按照预设的采样时间间隔,获取每个采样时刻对应的声音状态;如果该声音状态为有声状态,则将该采样时间间隔内的播放时间戳对应的场景确定为目标场景,并获取下一采样时刻对应的声音状态;如果该声音状态为无声状态,则将该采样时间间隔内的播放时间戳对应的场景确定为非目标场景,并将该采样时刻确定为当前播放时间戳,执行所述确定在所述当前播放时间戳之后且对应的声音状态为有声状态的最小播放时间戳,并将所述最小播放时间戳对应的场景确定为目标场景步骤。可选的,所述将该采样时间间隔内的播放时间戳对应的场景确定为非目标场景之前,还包括:根据该采样时刻、该采样时刻之后且对应的声音状态为有声状态的播放时间戳,确定最小检测时长;如果所述最小检测时长小于预设的检测时长阈值,则将该采样时间间隔内的播放时间戳对应的场景确定为目标场景,并获取下一采样时刻对应的声音状态;如果所述最小检测时长大于所述检测时长阈值,则执行将该采样时间间隔内的播放时间戳对应的场景确定为非目标场景步骤。可选的,所述方法还包括:接收客户端发送的视频获取请求,所述视频获取请求用于指示获取包含目标场景的目标视频;根据所述场景与播放时间戳的对应关系,确定所述目标场景对应的目标播放时间戳;根据所述目标播放时间戳,生成响应消息,并发送所述响应消息至所述客户端,所述响应消息用于确定所述目标视频中包含的所述目标场景。可选的,当所述客户端处于显示所述目标视频的状态时,所述根据所述目标播放时间戳,生成响应消息,并发送所述响应消息至所述客户端包括:生成包含所述目标播放时间戳的响应消息;将所述响应消息发送至所述客户端,以使所述客户端在当前显示所述目标视频的状态下,在预设的播放时间进度条中,显示所述目标场景的目标播放时间戳。可选的,当所述客户端处于未显示所述目标视频的状态时,所述根据所述目标播放时间戳,生成响应消息,并发送所述响应消息至所述客户端包括:在目标视频的视频数据中,获取所述目标播放时间戳对应的视频数据,得到响应消息;发送所述响应消息至所述客户端,以使所述客户端基于所述目标播放时间戳对应的视频数据显示所述目标场景。第二方面,提供了一种场景识别装置,其特征在于,所述装置包括:获取模块,用于获取待识别的目标视频;第一确定模块,用于通过预设的音频处理算法、所述目标视频的音频数据、以及所述音频数据在所述目标视频中对应的播放时间戳,确定声音状态与播放时间戳的对应关系,其中,所述声音状态包括有声状态和无声状态;建立模块,用于根据所述声音状态与播放时间戳的对应关系,确定对应的声音状态为有声状态的播放时间戳,将确定出的播放时间戳对应的场景确定为目标场景,以建立场景与播放时间戳的对应关系。可选的,所述建立模块包括:第一确定子模块,用于在当前播放时间戳对应的声音状态为无声状态时,确定在所述当前播放时间戳之后且对应的声音状态为有声状态的最小播放时间戳,并将所述最小播放时间戳对应的场景确定为目标场景;获取子模块,用于按照预设的采样时间间隔,获取每个采样时刻对应的声音状态;第二确定子模块,用于当该声音状态为有声状态时,将该采样时间间隔内的播放时间戳对应的场景确定为目标场景,并获取下一采样时刻对应的声音状态;第三确定子模块,用于当该声音状态为无声状态时,将该采样时间间隔内的播放时间戳对应的场景确定为非目标场景,并将该采样时刻确定为当前播放时间戳,执行所述确定在所述当前播放时间戳之后且对应的声音状态为有声状态的最小播放时间戳,并将所述最小播放时间戳对应的场景确定为目标场景步骤。可选的,所述建立模块还包括:第四确定子模块,用于根据该采样时刻、该采样时刻之后且对应的声音状态为有声状态的播放时间戳,确定最小检测时长;第二确定子模块,还用于当所述最小检测时长小于预设的检测时长阈值时,将该采样时间间隔内的播放时间戳对应的场景确定为目标场景,并获取下一采样时刻对应的声音状态;第三确定子模块,还用于当所述最小检测时长大于所述检测时长阈值时,执行将该采样时间间隔内的播放时间戳对应的场景确定为非目标场景步骤。可选的,所述装置还包括:接收模块,用于接收客户端发送的视频获取请求,所述视频获取请求用于指示获取包含目标场景的目标视频;第二确定模块,用于根据所述场景与播放时间戳的对应关系,确定所述目标场景对应的目标播放时间戳;发送模块,用于根据所述目标播放时间戳,生成响应消息,并发送所述响应消息至所述客户端,所述响应消息用于确定所述目标视频中包含的所述目标场景。可选的,当所述客户端处于显示所述目标视频的状态时,所述发送模块包括:第一生成子模块,用于生成包含所述目标播放时间戳的响应消息;第一发送子模块,用于将所述响应消息发送至所述客户端,以使所述客户端在当前显示所述目标视频的状态下,在预设的播放时间进度条中,显示所述目标场景的目标播放时间戳。可选的,当所述客户端处于未显示所述目标视频的状态时,所述发送模块包括:第二生成子模块,用于在目标视频的视频数据中,获取所述目标播放时间戳对应的视本文档来自技高网...

【技术保护点】
1.一种场景识别方法,其特征在于,所述方法包括:/n获取待识别的目标视频;/n通过预设的音频处理算法、所述目标视频的音频数据、以及所述音频数据在所述目标视频中对应的播放时间戳,确定声音状态与播放时间戳的对应关系,其中,所述声音状态包括有声状态和无声状态;/n根据所述声音状态与播放时间戳的对应关系,确定对应的声音状态为有声状态的播放时间戳,将确定出的播放时间戳对应的场景确定为目标场景,以建立场景与播放时间戳的对应关系。/n

【技术特征摘要】
1.一种场景识别方法,其特征在于,所述方法包括:
获取待识别的目标视频;
通过预设的音频处理算法、所述目标视频的音频数据、以及所述音频数据在所述目标视频中对应的播放时间戳,确定声音状态与播放时间戳的对应关系,其中,所述声音状态包括有声状态和无声状态;
根据所述声音状态与播放时间戳的对应关系,确定对应的声音状态为有声状态的播放时间戳,将确定出的播放时间戳对应的场景确定为目标场景,以建立场景与播放时间戳的对应关系。


2.根据权利要求1所述的方法,其特征在于,所述根据所述声音状态与播放时间戳的对应关系,确定对应的声音状态为有声状态的播放时间戳,将确定出的播放时间戳对应的场景确定为目标场景包括:
在当前播放时间戳对应的声音状态为无声状态时,确定在所述当前播放时间戳之后且对应的声音状态为有声状态的最小播放时间戳,并将所述最小播放时间戳对应的场景确定为目标场景;
按照预设的采样时间间隔,获取每个采样时刻对应的声音状态;
如果该声音状态为有声状态,则将该采样时间间隔内的播放时间戳对应的场景确定为目标场景,并获取下一采样时刻对应的声音状态;
如果该声音状态为无声状态,则将该采样时间间隔内的播放时间戳对应的场景确定为非目标场景,并将该采样时刻确定为当前播放时间戳,执行所述确定在所述当前播放时间戳之后且对应的声音状态为有声状态的最小播放时间戳,并将所述最小播放时间戳对应的场景确定为目标场景步骤。


3.根据权利要求2所述的方法,其特征在于,所述将该采样时间间隔内的播放时间戳对应的场景确定为非目标场景之前,还包括:
根据该采样时刻、该采样时刻之后且对应的声音状态为有声状态的播放时间戳,确定最小检测时长;
如果所述最小检测时长小于预设的检测时长阈值,则将该采样时间间隔内的播放时间戳对应的场景确定为目标场景,并获取下一采样时刻对应的声音状态;
如果所述最小检测时长大于所述检测时长阈值,则执行将该采样时间间隔内的播放时间戳对应的场景确定为非目标场景步骤。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收客户端发送的视频获取请求,所述视频获取请求用于指示获取包含目标场景的目标视频;
根据所述场景与播放时间戳的对应关系,确定所述目标场景对应的目标播放时间戳;
根据所述目标播放时间戳,生成响应消息,并发送所述响应消息至所述客户端,所述响应消息用于确定所述目标视频中包含的所述目标场景。


5.根据权利要求4所述的方法,其特征在于,当所述客户端处于显示所述目标视频的状态时,所述根据所述目标播放时间戳,生成响应消息,并发送所述响应消息至所述客户端包括:
生成包含所述目标播放时间戳的响应消息;
将所述响应消息发送至所述客户端,以使所述客户端在当前显示所述目标视频的状态下,在预设的播放时间进度条中,显示所述目标场景的目标播放时间戳。


6.根据权利要求4所述的方法,其特征在于,当所述客户端处于未显示所述目标视频的状态时,所述根据所述目标播放时间戳,生成响应消息,并发送所述响应消息至所述客户端包括:
在目标视频的视频数据中,获取所述目标播放时间戳对应的视频数据,得到响应消息;
发送所述响应消息至所述客户端,以使所述客户端基于所述目标播放时间戳对应的视频数据显示所述目标场景。


7.一种场景识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别的目标视频;
第一确定模块,用于通过预设的音频处理算法、所述目标视频的音频数据、以及所述音频数据在所述目标视频中对应的播放时间戳,确定声音...

【专利技术属性】
技术研发人员:王聪
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1