片尾的开始位置识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37357801 阅读:17 留言:0更新日期:2023-04-27 07:07
本申请实施例提供了一种片尾的开始位置识别方法、装置、电子设备及存储介质,涉及视频处理技术领域,方法包括:获取待识别的视频文件;视频文件包括多个待识别视频帧和对应的各待识别音频帧;从各待识别音频帧中确定包含指定片尾类型的音频数据的音频帧片段中时间戳最早的第一音频帧;从各待识别视频帧中确定包含片尾字幕且时间戳最早的第一视频帧;从指定时间戳区间内的待识别视频帧中确定发生转场且时间戳最早的第二视频帧;指定时间戳区间的起始时间戳与第一音频帧对应,终止时间戳与第一视频帧对应;基于第二视频帧在视频文件中的位置,确定片尾的开始位置。基于此,能够有效地确定出片尾的开始位置,提高片尾的开始位置的识别效率和准确性。识别效率和准确性。识别效率和准确性。

【技术实现步骤摘要】
片尾的开始位置识别方法、装置、电子设备及存储介质


[0001]本申请涉及视频处理
,特别是涉及一种片尾的开始位置识别方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,在视频播放平台中,往往需要在不影响用户观看正片的情况下,在视频的正片和片尾之间插入其他资源,例如,广告。因此,对于视频播放平台,准确地识别视频的片尾的开始位置十分重要。
[0003]相关技术中,通常需要人工浏览视频,以识别视频的片尾的开始位置,然而,视频播放平台的视频数量较大,且视频片尾的样式也较多,采用人工识别的方式成本较高,效率较低,且人工识别片尾的开始位置的准确性也难以保证。

技术实现思路

[0004]本申请实施例的目的在于提供一种片尾的开始位置识别方法、装置、电子设备及存储介质,以提高片尾的开始位置的识别效率和识别准确性。具体技术方案如下:
[0005]在本申请实施的第一方面,首先提供了一种片尾的开始位置识别方法,所述方法包括:
[0006]获取待识别的视频文件;其中,所述视频文件包括多个待识别视频帧和对应的各待识别本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种片尾的开始位置识别方法,其特征在于,所述方法包括:获取待识别的视频文件;其中,所述视频文件包括多个待识别视频帧和对应的各待识别音频帧;从各待识别音频帧中,确定包含指定片尾类型的音频数据的音频帧片段中时间戳最早的音频帧,作为第一音频帧;从各待识别视频帧中确定包含片尾字幕,且时间戳最早的视频帧,作为第一视频帧;从指定时间戳区间内的待识别视频帧中,确定发生转场且时间戳最早的视频帧,作为第二视频帧;其中,所述指定时间戳区间的起始时间戳与所述第一音频帧对应,且终止时间戳与所述第一视频帧对应;基于所述第二视频帧在所述视频文件中的位置,确定片尾的开始位置。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述指定时间戳区间内的待识别视频帧中不存在所述第二视频帧,基于第三视频帧在所述视频文件中的位置,确定片尾的开始位置;其中,所述第三视频帧为:所述指定时间戳区间内的待识别视频帧中时间戳最早的黑屏视频帧。3.根据权利要求2所述的方法,其特征在于,在所述基于第三视频帧在所述视频文件中的位置,确定片尾的开始位置之前,所述方法还包括:获取第二音频帧的时间戳;其中,所述第二音频帧为所述指定时间戳区间内静音的音频帧片段中时间戳最早的音频帧;所述基于第三视频帧在所述视频文件中的位置,确定片尾的开始位置,包括:若所述第二音频帧与所述第三视频帧之间的时序距离小于第一预设阈值,则将所述第二音频帧在所述视频文件中的位置,确定为片尾的开始位置;若所述第二音频帧与所述第三视频帧之间的时序距离不小于第一预设阈值,则将所述第三视频帧在所述视频文件中的位置,确定为片尾的开始位置。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:若所述指定时间戳区间内的待识别视频帧中不存在所述第二视频帧,且不存在所述第三视频帧,则将第二音频帧在所述视频文件中的位置,确定为片尾的开始位置;其中,所述第二音频帧为所述指定时间戳区间内静音的音频帧片段中时间戳最早的待识别音频帧。5.根据权利要求1所述的方法,其特征在于,在所述基于所述第二视频帧在所述视频文件中的位置,确定片尾的开始位置之前,所述方法还包括:获取第二音频帧的时间戳;其中,所述第二音频帧为所述指定时间戳区间内静音的音频帧片段中时间戳最早的待识别音频帧;所述基于所述第二视频帧在所述视频文件中的位置,确定片尾的开始位置,包括:若所述第二音频帧与所述第二视频帧之间的时序距离小于第一预设阈值,则将所述第二音频帧在所述视频文件中的位置,确定为片尾的开始位置;若所述第二音频帧与所述第二视频帧之间的时序距离不小于第一预设阈值,则将所述第二视频帧在所述视频文件中的位置,确定为片尾的开始位置。6.根据权利要求3

5任一项所述的方法,其特征在于,所述静音的音频帧片段中每一音频帧的音量小于预设音量值,且该音频帧片段的持续时长大于预设时长。7.根据权利要求1所述的方法,其特征在于,所述从各待识别音频帧中,确定包含指定<...

【专利技术属性】
技术研发人员:尹天舒
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1