一种场景切换点的检测方法及装置制造方法及图纸

技术编号：11203828 阅读：71 留言：0更新日期：2015-03-26 11:52

本发明专利技术提供一种场景切换点的检测方法及装置，包括：获取第一视频；提取所述第一视频中音频数据作为第一音频数据；根据所述第一音频数据确定场景的切换位置。通过使用以上方法，可以根据视频中的具体音频信息来判断视频中场景的切换，避免了现有技术中依赖人工进行标注的复杂工作，提高了视频处理的工作效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数字多媒体
，特别是一种场景切换点的检测方法及装置。
技术介绍
随着数字多媒体技术的快速发展，越来越多的多媒体技术应用到人们的工作和生活中。在视频编辑领域，经常会接触到“关键帧”的概念，我们可以使用相关算法或工具处理得到某一视频中存在的所有关键帧。例如，在某个电视剧中，从5分30秒开始至10分15秒是一个在咖啡厅会谈的场景；而在10分16秒至12分30秒时是在汽车中对话的场景。因此，在10分16秒里包含一个关键帧，而此处正好是一个场景开始的位置。并且在该时间点后续的对话中，可能会频繁的切换镜头角度，导致相关的算法或工具判断出很多的关键帧，但这些关键帧都不是场景正确的结束位置。由于在实际中一个场景会有很多个镜头切换，因此仅通过关键帧数据是无法比较准确的定位一个较完整的场景的开始或结束位置。现有的视频场景的标注方法是由人工浏览影片的方式确定不同场景的开始或结束位置。这对编辑人员的经验以及工作强度要求较高，且处理效率很低。因此，如何提供一种可以对场景切换点进行自动检测的方法和装置是本专利技术需要解决的...

【技术保护点】
一种场景切换点的检测方法，其特征在于，包括：获取第一视频；提取所述第一视频中音频数据作为第一音频数据；根据所述第一音频数据确定场景的切换位置。

【技术特征摘要】
1.一种场景切换点的检测方法，其特征在于，包括：
获取第一视频；
提取所述第一视频中音频数据作为第一音频数据；
根据所述第一音频数据确定场景的切换位置。
2.根据权利要求1所述的方法，其特征在于，所述提取所述第一视频中音频数据作为第一音频数据，具体为：
提取所述第一视频中的人声音频作为所述第一音频数据。
3.根据权利要求1所述的方法，其特征在于，所述提取所述第一视频中音频数据作为第一音频数据，具体为：
提取所述第一视频中的背景音频作为所述第一音频数据。
4.根据权利要求2或3所述的方法，其特征在于，所述根据所述第一音频数据确定场景的切换位置，具体为：
检测第一音频数据中的声波变化特征；
根据所述声波变化特征确定场景的切换位置。
5.根据权利要求1所述的方法，其特征在于，在根据所述第一音频数据确定场景的切换位置之后，还包括：
获取预判位置信息；
根据所述预判位置信息修正所述场景的切换位置。
6.一种场景切换点的检测装置，其特征在于，包括：视频获取单元、第一音频提取单元和切换位置确定单元；
...

【专利技术属性】
技术研发人员：吴凯凯，卢学裕，付鹏，白雪，吴鑫，姚键，潘柏宇，卢述奇，
申请(专利权)人：合一网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人