一种视频片头片尾识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号:34898055 阅读:23 留言:0更新日期:2022-09-10 13:58
本发明专利技术提供一种视频片头片尾识别方法、装置、设备及可读存储介质,涉及视频识别技术领域。该方法包括:根据目标视频的识别信息,获取目标视频发生场景切换的第一时间范围;其中,识别信息包括声音、图像以及文字识别信息中的至少一项;对第一时间范围中第一时刻之前的第一时长内的多帧第一图像与第一时刻之后的第一时长内的多帧第二图像进行匹配,获取第一匹配结果;对第一时间范围中第一时刻之前的第一时长内的第一声音数据与第一时刻之后的第一时长内的第二声音数据进行匹配,获取第二匹配结果;根据第一匹配结果和第二匹配结果,获取目标视频的片头结束时刻或片尾开始时刻。本发明专利技术的方案能够高效、准确识别视频片头片尾。准确识别视频片头片尾。准确识别视频片头片尾。

【技术实现步骤摘要】
一种视频片头片尾识别方法、装置、设备及可读存储介质


[0001][0002]本专利技术属于视频识别
,尤其是涉及一种视频片头片尾识别方法、装置、设备及可读存储介质。

技术介绍

[0003]现有视频播放软件会为用户提供跳过视频片头片尾的选项,用以提升用户的体验感,并节省观看时间。然而,目前的视频片头片尾识别方法一般采取人工标注方法或者采用视频指纹技术。
[0004]其中,人工标注方法,通过人工编辑片头片尾时间点,需要耗费大量的人力观看视频,进行标注,识别效率低而且成本高。视频指纹技术,仅在设定的检测时间区域进行视频指纹检测,然后根据检测结果确定片头片尾时间点,依赖视频指纹,视频指纹的检测结果大大影响识别准确率。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种视频片头片尾识别方法、装置、设备及可读存储介质,从而解决现有技术中视频片头片尾识别效率低以及准确率低的问题。
[0006]为了实现上述目的,本专利技术的实施例提供了一种视频片头片尾识别方法,包括:
[0007]根据目标视频的识别信息,获取所述目标视频发生场景切换的第一时间范围;其中,所述识别信息包括声音、图像以及文字识别信息中的至少一项;
[0008]对所述第一时间范围中第一时刻之前的第一时长内的多帧第一图像与所述第一时刻之后的第一时长内的多帧第二图像进行匹配,获取第一匹配结果;
[0009]对所述第一时间范围中第一时刻之前的第一时长内的第一声音数据与所述第一时刻之后的第一时长内的第二声音数据进行匹配,获取第二匹配结果;
[0010]根据所述第一匹配结果和所述第二匹配结果,获取所述目标视频的片头结束时刻或片尾开始时刻。
[0011]可选地,所述的视频片头片尾识别方法,所述根据目标视频的识别信息,获取所述目标视频发生场景切换的第一时间范围,包括:
[0012]将所述目标视频前第二时长内的第三声音数据划分为多个子声音数据,或者,将所述目标视频后第二时长内的第三声音数据划分为多个子声音数据;
[0013]按照预设间隔帧数,获取所述目标视频前第二时长内的视频片段中的多帧图像,或者,获取所述目标视频后第二时长内的视频片段中的多帧图像;
[0014]基于以下至少一项,获取所述目标视频发生场景切换的第一时间范围:
[0015]所述多个子声音数据的声音识别信息之间的场景匹配度;
[0016]所述多帧图像的图像识别信息之间的场景匹配度;
[0017]所述多帧图像的文字识别信息之间的场景匹配度。
[0018]可选地,所述的视频片头片尾识别方法,所述对所述第一时间范围中第一时刻之前的第一时长内的多帧第一图像与所述第一时刻之后的第一时长内的多帧第二图像进行匹配,获取第一匹配结果,包括:
[0019]对于所述多帧第一图像,进行目标分割,并获取分割后的第一目标的定位信息和图像特征信息;
[0020]根据所述多帧第一图像中所述第一目标的定位信息和图像特征信息,建立所述第一目标的运动轨迹模型;
[0021]根据所述运动轨迹模型,获取所述第一目标在所述多帧第二图像中的预测位置;
[0022]将所述多帧第二图像中所述第一目标的所在位置与所述预测位置进行匹配,获取所述第一匹配结果。
[0023]可选地,所述的视频片头片尾识别方法,在所述对于所述多帧第一图像,进行目标分割之后,所述方法还包括:
[0024]采用预设形状特征信息,在所述多帧第一图像中,获取颜色与背景相差小于预设阈值的目标。
[0025]可选地,所述的视频片头片尾识别方法,所述对所述第一时间范围中第一时刻之前的第一时长内的第一声音数据与所述第一时刻之后的第一时长内的第二声音数据进行匹配,获取第二匹配结果,包括:
[0026]通过识别所述第一声音数据和所述第二声音数据中的声学信息和语义信息,获取所述第一声音数据对应的第一场景,以及所述第二声音数据对应的第二场景;
[0027]对所述第一场景与所述第二场景进行匹配,获取所述第二匹配结果。
[0028]可选地,所述的视频片头片尾识别方法,所述根据所述第一匹配结果和所述第二匹配结果,获取所述目标视频的片头结束时刻或片尾开始时刻,包括:
[0029]获取所述第一匹配结果小于第一匹配阈值的至少一帧第二图像所对应的第二时间范围;
[0030]获取所述第二匹配结果小于第二匹配阈值的至少一个第二声音数据所对应的第三时间范围;
[0031]基于所述第二时间范围和所述第三时间范围,获取所述片头结束时刻或所述片尾开始时刻。
[0032]可选地,所述的视频片头片尾识别方法,所述基于所述第二时间范围和所述第三时间范围,获取所述片头结束时刻或所述片尾开始时刻,包括:
[0033]根据所述第二时间范围和所述第三时间范围的重合时刻,获取所述片头结束时刻或所述片尾结束时刻。
[0034]为了实现上述目的,本专利技术的实施例还提供一种视频片头片尾识别装置,包括:
[0035]第一获取模块,用于根据目标视频的识别信息,获取所述目标视频发生场景切换的第一时间范围;其中,所述识别信息包括声音、图像以及文字识别信息中的至少一项;
[0036]第二获取模块,用于对所述第一时间范围中第一时刻之前的第一时长内的多帧第一图像与所述第一时刻之后的第一时长内的多帧第二图像进行匹配,获取第一匹配结果;
[0037]第三获取模块,用于对所述第一时间范围中第一时刻之前的第一时长内的第一声音数据与所述第一时刻之后的第一时长内的第二声音数据进行匹配,获取第二匹配结果;
[0038]第四获取模块,用于根据所述第一匹配结果和所述第二匹配结果,获取所述目标视频的片头结束时刻或片尾开始时刻。
[0039]为了实现上述目的,本专利技术的实施例还提供一种视频片头片尾识别设备,包括收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;所述处理器执行所述程序或指令时实现如上任一项所述的视频片头片尾识别方法中的步骤。
[0040]为了实现上述目的,本专利技术的实施例还提供一种可读存储介质,用于存储计算机程序,所述计算机程序被处理器执行时实现如上所述的视频片头片尾识别方法中的步骤。
[0041]本专利技术的上述技术方案至少具有如下有益效果:
[0042]本专利技术实施例的上述方案中,根据目标视频的识别信息,获取所述目标视频发生场景切换的第一时间范围,并对所述第一时间范围中第一时刻之前的第一时长内的多帧第一图像与所述第一时刻之后的第一时长内的多帧第二图像进行匹配,获取第一匹配结果,以及对所述第一时间范围中第一时刻之前的第一时长内的第一声音数据与所述第一时刻之后的第一时长内的第二声音数据进行匹配,获取第二匹配结果,从而根据所述第一匹配结果和所述第二匹配结果,获取所述目标视频的片头结束时刻或片尾开始时刻,即通过图像识别技术和声音识别技术,分析识别片头结束时刻或片尾开始时刻,具有识别效率高和识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频片头片尾识别方法,其特征在于,包括:根据目标视频的识别信息,获取所述目标视频发生场景切换的第一时间范围;其中,所述识别信息包括声音、图像以及文字识别信息中的至少一项;对所述第一时间范围中第一时刻之前的第一时长内的多帧第一图像与所述第一时刻之后的第一时长内的多帧第二图像进行匹配,获取第一匹配结果;对所述第一时间范围中第一时刻之前的第一时长内的第一声音数据与所述第一时刻之后的第一时长内的第二声音数据进行匹配,获取第二匹配结果;根据所述第一匹配结果和所述第二匹配结果,获取所述目标视频的片头结束时刻或片尾开始时刻。2.根据权利要求1所述的方法,其特征在于,所述根据目标视频的识别信息,获取所述目标视频发生场景切换的第一时间范围,包括:将所述目标视频前第二时长内的第三声音数据划分为多个子声音数据,或者,将所述目标视频后第二时长内的第三声音数据划分为多个子声音数据;按照预设间隔帧数,获取所述目标视频前第二时长内的视频片段中的多帧图像,或者,获取所述目标视频后第二时长内的视频片段中的多帧图像;基于以下至少一项,获取所述目标视频发生场景切换的第一时间范围:所述多个子声音数据的声音识别信息之间的场景匹配度;所述多帧图像的图像识别信息之间的场景匹配度;所述多帧图像的文字识别信息之间的场景匹配度。3.根据权利要求1所述的方法,其特征在于,所述对所述第一时间范围中第一时刻之前的第一时长内的多帧第一图像与所述第一时刻之后的第一时长内的多帧第二图像进行匹配,获取第一匹配结果,包括:对于所述多帧第一图像,进行目标分割,并获取分割后的第一目标的定位信息和图像特征信息;根据所述多帧第一图像中所述第一目标的定位信息和图像特征信息,建立所述第一目标的运动轨迹模型;根据所述运动轨迹模型,获取所述第一目标在所述多帧第二图像中的预测位置;将所述多帧第二图像中所述第一目标的所在位置与所述预测位置进行匹配,获取所述第一匹配结果。4.根据权利要求3所述的方法,其特征在于,在所述对于所述多帧第一图像,进行目标分割之后,所述方法还包括:采用预设形状特征信息,在所述多帧第一图像中,获取颜色与背景相差小于预设阈值的目标。5.根据权利要求1所述的方法,其特征在于,所述对所述第一时间范围中第一时刻之前的...

【专利技术属性】
技术研发人员:张楠冯海洋李征张晓迪孙方明张春江
申请(专利权)人:北京视达科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1