识别跳舞教学视频片段的方法、装置及终端设备制造方法及图纸

技术编号:37812473 阅读:14 留言:0更新日期:2023-06-09 09:42
本申请涉及互联网技术领域,公开了一种识别跳舞教学视频片段的方法、装置、终端设备、服务端及存储介质。该方法包括:在跳舞教学视频中提取音乐片段;将音乐片段的音频特征与其完整音乐音频的音频特征进行匹配处理,得到第一结果;将音乐片段的歌词与其完整音乐音频的歌词进行匹配处理,得到第二结果;基于第一结果和第二结果,确定音乐片段所属的演示子视频在跳舞教学视频中的起、止位置;将演示子视频识别为正面或背面演示;在跳舞教学视频中提取纯人声片段;确定纯人声片段所属的教学子视频在跳舞教学视频中的起、止位置;将教学子视频识别为正面或背面教学。利用本申请能够高效准确地确定跳舞教学视频中的各个分段教学视频。地确定跳舞教学视频中的各个分段教学视频。地确定跳舞教学视频中的各个分段教学视频。

【技术实现步骤摘要】
识别跳舞教学视频片段的方法、装置及终端设备


[0001]本申请涉及互联网
,具体涉及视频处理技术,尤其涉及一种识别跳舞教学视频片段的方法、装置、终端设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]用户通过终端设备观看视频,可以学习各种知识,增加自己的见识和知识面。对于教学类视频,通常是指围绕特定主题进行教学或授课为主的视频,通常这类教学视频可视为包含多个部分,例如,对于阅读类的教学视频,整个视频可视为包含多个章节,对于舞蹈类的教学视频,整个视频可视为包含多组舞蹈动作。
[0003]通过对教学视频进行打点分段,对完整视频中的多个教学部分进行标识,用户可以快速定位至想要观看的位置,学习感兴趣的教学内容。但是,现有的视频打点分段,通常采用人工打点的方式,针对每一个视频需要工作人员从头到尾观看播放,对视频中不同部分进行打点和分段,对每一部分输入对应的标签。这种人工打点的方式消耗大量时间和人力,并且容易出现打点错误、标签与视频分段内容不一致等问题。

技术实现思路

[0004]有鉴于此,本申请实施例提供一种识别跳舞教学视频片段的方法、装置、服务端设备、计算机可存储介质及计算机程序产品,用于解决至少一种技术问题。
[0005]第一方面,本申请实施例提供一种识别跳舞教学视频片段的方法,所述跳舞教学视频中包括用于跳舞演示的演示子视频和用于跳舞教学的教学子视频,所述演示子视频仅包括音乐片段,所述教学子视频仅包括纯人声片段;所述识别跳舞教学视频片段的方法包括:在跳舞教学视频中提取第一音乐片段;将所述第一音乐片段的音频特征与其完整音乐音频的音频特征进行匹配处理,得到第一匹配结果,所述第一匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息;将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理,得到第二匹配结果,所述第二匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息;基于第一匹配结果和第二匹配结果,确定所述第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置;基于所述演示子视频中跳舞演示者的特征将所述演示子视频识别为正面演示或背面演示;在所述跳舞教学视频中提取第一纯人声片段;通过扩大所述第一纯人声片段的时长并判断扩大后是否仍为纯人声片段的方式,确定所述第一纯人声片段所属的教学子视频在所述跳舞教学视频中的起始位置和终止位置;基于所述教学子视频中跳舞教学者的特征将所述教学子视频识别为正面教学或背面教学。
[0006]根据本申请实施例的方法,在教学视频中提取第一音乐片段或第一纯人声片段时,进一步包括: 在所述跳舞教学视频中随机提取目标音频片段,判断目标音频片段是否仅包括一种声音;当目标音频片段包括多种声音时,将目标音频片段时长折半处理,直至目标音频片段仅包括一种声音;确定仅包括一种声音的目标音频片段为第一音乐片段或第一
纯人声片段。
[0007]根据本申请实施例的方法,基于所述第一匹配结果和所述第二匹配结果无法确定第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置时,扩大所述第一音乐片段的时长后重新匹配直至能够确定第一音乐片段所属的演示子视频在跳舞教学视频中的起始位置和终止位置。
[0008]根据本申请实施例的方法,将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理,得到第二匹配结果,包括:在第一音乐片段对应的关键帧图像中提取文本信息;在文本信息中获得第一音乐片段的歌词并与其完整音乐音频的歌词匹配得到第二匹配结果。
[0009]根据本申请实施例的方法,当所述文本信息中包括报幕文本时,在跳舞教学视频中重新提取第一音乐片段。
[0010]根据本申请实施例的方法,当所述演示子视频中包括跳舞演示者的正脸时,确定所述演示子视频为正面演示,否则为背面演示和/或当所述教学子视频包括跳舞教学者的正脸时,确定所述教学子视频为正面教学,否则为背面教学。
[0011]根据本申请实施例的方法, 当所述演示子视频包括多个不同的跳舞演示者时,确定所述演示子视频为多人跳舞视频。
[0012]第二方面,本申请实施例提供一种识别跳舞教学视频片段的装置,包括:第一提取模块,用于在跳舞教学视频中提取第一音乐片段;匹配模块,用于将所述第一音乐片段的音频特征与其完整音乐音频的音频特征进行匹配处理,得到第一匹配结果,所述第一匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息;将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理,得到第二匹配结果,所述第二匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息;第一确定模块,用于基于第一匹配结果和第二匹配结果,确定所述第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置;第一识别模块,用于基于所述演示子视频中跳舞演示者的特征将所述演示子视频识别为正面演示或背面演示;第二提取模块,用于在所述跳舞教学视频中提取第一纯人声片段;第二确定模块,用于通过扩大所述第一纯人声片段的时长并判断扩大后是否仍为纯人声片段的方式,确定所述第一纯人声片段所属的教学子视频在所述跳舞教学视频中的起始位置和终止位置;第二识别模块,用于基于所述教学子视频中跳舞教学者的特征将所述教学子视频识别为正面教学或背面教学。
[0013]第三方面,本申请的实施例提供一种终端设备,其特征在于,包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如上所述的方法。
[0014]第四方面,本申请的实施例提供一种计算机可读存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的方法。
[0015]第五方面,本申请的实施例提供一种计算机程序产品,其特征在于,其包括计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的方法。
[0016]本申请的实施例针对跳舞教学视频进行打点分段,通过对跳舞教学视频文件中包含的音频(背景音乐)和文本(歌词或台词)进行识别,确定跳舞教学视频中的舞蹈动作演示
片段的起止位置,并通过对跳舞演示者的特征识别判断是正面演示还是背面演示;并且,本申请的实施例还通过对跳舞教学视频文件中的纯人声片段的识别,确定教学视频中的讲解片段的起止位置,并可判断是正面教学还是背面教学。照此打点分段之后,能够方便用户快速定位到舞蹈动作演示片段以及带人声讲解的片段,方便用户集中学习舞蹈的正面动作以及背面动作,操作十分便捷。利用本申请实施例提供的方法对跳舞教学视频进行自动打点分段,能够大幅减少视频处理过程中由人为因素引入的错误操作,不仅能够高效、准确地确定跳舞教学视频中的每个分段视频,还节省人工成本。
附图说明
[0017]为了更清楚地说明本申请实施例的技术方案,以下对本申请实施例中的附图作简单介绍。
[0018]图1是根据本申请实施例的识别跳舞教学视频片段方法的流程框图。
[0019]图2是根据本申请实施例的提取第一音乐片段或第一纯人声片段方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别跳舞教学视频片段的方法,其特征在于,所述跳舞教学视频中包括用于跳舞演示的演示子视频和用于跳舞教学的教学子视频,所述演示子视频仅包括音乐片段,所述教学子视频仅包括纯人声片段;所述识别跳舞教学视频片段的方法包括:在跳舞教学视频中提取第一音乐片段;将所述第一音乐片段的音频特征与其完整音乐音频的音频特征进行匹配处理,得到第一匹配结果,所述第一匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息;将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理,得到第二匹配结果,所述第二匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息;基于第一匹配结果和第二匹配结果,确定所述第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置;基于所述演示子视频中跳舞演示者的特征将所述演示子视频识别为正面演示或背面演示;在所述跳舞教学视频中提取第一纯人声片段;通过扩大所述第一纯人声片段的时长并判断扩大后是否仍为纯人声片段的方式,确定所述第一纯人声片段所属的教学子视频在所述跳舞教学视频中的起始位置和终止位置;以及基于所述教学子视频中跳舞教学者的特征将所述教学子视频识别为正面教学或背面教学。2.根据权利要求1所述的方法,其特征在于,其中,在教学视频中提取第一音乐片段或第一纯人声片段时,进一步包括:在所述跳舞教学视频中随机提取目标音频片段,判断目标音频片段是否仅包括一种声音;当目标音频片段包括多种声音时,将目标音频片段时长折半处理,直至目标音频片段仅包括一种声音;以及确定仅包括一种声音的目标音频片段为第一音乐片段或第一纯人声片段。3.根据权利要求1所述的方法,其特征在于,其中,基于所述第一匹配结果和所述第二匹配结果无法确定第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置时,扩大所述第一音乐片段的时长后重新匹配直至能够确定第一音乐片段所属的演示子视频在跳舞教学视频中的起始位置和终止位置。4.根据权利要求1所述的方法,其特征在于,其中,将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理,得到第二匹配结果,包括:在第一音乐片段对应的关键帧图像中提取文本信息;在文本信息中获得第一音乐片段的歌词并与其完整音乐音频的歌词匹配得到第二匹配结果。5.根据权利要求4所述的方法,其特征在于, 其中,当...

【专利技术属性】
技术研发人员:章动孙健张远
申请(专利权)人:北京小糖科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1