【技术实现步骤摘要】
视频切分方法、装置、设备及存储介质
[0001]本公开实施例涉及视频处理
,尤其涉及一种视频切分方法、装置、设备及存储介质。
技术介绍
[0002]视频切分是视频分析中的一种重要手段,尤其是对于具有人物发言的视频(比如,新闻视频、直播视频)来说,通过视频切分可以将人物发言片段从视频中切分出来,从而方便对发言内容进行分析和总结。但是现有的视频切分方法大多是以单模态数据(比如,音频、图像或字幕)作为依据进行的切分,数据较为单一,精确度较低。
技术实现思路
[0003]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种视频切分方法、装置、设备及存储介质。
[0004]本公开实施例的第一方面提供了一种视频切分方法,该方法包括:基于视频中的至少一部分视频帧的第一模态数据对该部分视频帧进行目标事件的第一检测处理,得到第一检测结果;基于该部分视频帧的第二模态数据对该部分视频帧进行目标事件的第二检测处理,得到第二检测结果;基于第一检测结果和第二检测结果,从该部分视频帧中确定出发生目标事件的目标帧;基于目标帧对视频进行切分,得到发生目标事件的视频片段。
[0005]本公开实施例的第二方面提供了一种视频切分方法,该方法包括:
[0006]基于直播视频中的至少一部分视频帧的第一模态数据对该部分视频帧进行发言人检测处理,得到第一检测结果;基于该部分视频帧的第二模态数据对该部分视频帧进行发言人检测处理,得到第二检测结果;基于第一检测结果和第二检测结果,从该部分视频帧中确定出 ...
【技术保护点】
【技术特征摘要】
1.一种视频切分方法,其特征在于,包括:基于视频中的至少一部分视频帧的第一模态数据对所述至少一部分视频帧进行目标事件的第一检测处理,得到第一检测结果;基于所述至少一部分视频帧的第二模态数据对所述至少一部分视频帧进行所述目标事件的第二检测处理,得到第二检测结果;基于所述第一检测结果和所述第二检测结果,从所述至少一部分视频帧中确定出发生所述目标事件的目标帧;基于所述目标帧对所述视频进行切分,得到发生所述目标事件的视频片段。2.根据权利要求1所述的方法,其特征在于,所述目标事件包括发言事件;所述第一检测结果和所述第二检测结果用于指示视频帧中有人发言的概率。3.根据权利要求2所述的方法,其特征在于,所述第一模态数据为图像数据。4.根据权利要求3所述的方法,其特征在于,所述基于视频中的至少一部分视频帧的第一模态数据对所述至少一部分视频帧进行目标事件的第一检测处理,得到第一检测结果,包括:对所述至少一部分视频帧的图像进行人脸检测处理,得到包括人脸的第一视频帧和不包括人脸的第二视频帧;对所述第一视频帧进行发言人检测处理,得到所述第一视频帧中有人发言的概率;确定所述第二视频帧中有人发言的概率为0。5.根据权利要求4所述的方法,其特征在于,所述对所述第一视频帧进行发言人检测处理,包括:对所述第一视频帧进行人脸识别处理,得到所述第一视频帧上的人脸识别框;在所述人脸识别框中进行发言人检测处理。6.根据权利要求2所述的方法,其特征在于,所述第二模态数据为音频数据。7.根据权利要求6所述的方法,其特征在于,所述基于所述至少一部分视频帧的第二模态数据对所述至少一部分视频帧进行所述目标事件的第二检测处理,得到第二检测结果,包括:对所述至少一部分视频帧的音频数据进行人声检测处理,得到各视频帧有人发言的概率。8.根据权利要求2所述的方法,其特征在于,所述基于所述第一检测结果和所述第二检测结果,从所述至少一部分视频帧中确定出发生所述目标事件的目标帧,包括:针对所述至少一部分视频帧中的每个视频帧,将所述视频帧对应的第一检测结果和第二检测结果进行加权求和处理,得到对应的加权求和结果;将所述至少一部分视频帧中对应所述加权求和结果大于预设阈值的视频帧确定为目标帧。9.根据权利要求1-8中任一项所述的方法,其特征在于,所述基于所述目标帧对所述视频进行切分,得到发生所述目标事件的视频片段,包括:响应于两个目标帧之间的非目标帧的数量小于预设数量,将所述两个目标帧切分到同一个视频片段中;响应于两个目标帧之间的非目标帧的数量大于所述预设数量,将所述两个目标帧切分
到两个不同的视频片段中。10.根据权利要求1-8中任一项所述的方法,其特征在于,在得到所述视频片段后,所述方法还包括:将所述视频片段中的音频数据转换成文本数据,并对所述文本数据进行主题抽取处理;根据所述文本数据中的主题,对所述视频片段进行切分。11.根据权利要求1-8中任一项所述的方法,其特征在于,在得到所述视频片段后,所述方法还包括:对所述视频片段中的发言...
【专利技术属性】
技术研发人员:董琦聪,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。