一种视频处理的方法和装置制造方法及图纸

技术编号:19220186 阅读:44 留言:0更新日期:2018-10-20 08:24
本发明专利技术实施例提供了一种视频处理的方法和装置,所述方法包括:获取目标视频数据;从所述目标视频数据中,确定多个第一关键帧,并基于所述多个第一关键帧,将所述目标视频数据的字幕信息划分为一个或多个第一字幕片段;针对每个第一字幕片段,确定对应的第一字幕向量;将所述第一字幕向量输入预先建立的数据模型,并接收所述数据模型输出针对所述目标视频数据的内容描述信息。通过本发明专利技术实施例,实现了基于视频字幕,自动生成视频的内容描述,提升了内容描述生成的效率,减少了人力成本。

【技术实现步骤摘要】
一种视频处理的方法和装置
本专利技术涉及视频处理
,特别是涉及一种视频处理的方法和装置。
技术介绍
随着互联网技术的发展,电视剧、电影等视频资源越来越多,且部分视频资源的篇幅较长,用户若完整观看需要花费用户大量的时间。目前,对于没有时间观看视频,或者,不想完整观看视频的用户,通常可以采用人工的方式,即由工作人员在观看视频资源后,用语言文字总结出视频资源的主要内容,并发布给需要观看的用户。然而,这种人工的方式通常只针对热度较高的视频资源,不可能对每个视频资源进行总结,且每次总结都需要工作人员完整观看该视频资源,效率低且花费大量的人力成本。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供克服上述问题或者至少部分地解决上述问题的一种视频处理的方法和装置。为了解决上述问题,本专利技术实施例公开了一种视频处理的方法,所述方法包括:获取目标视频数据;从所述目标视频数据中,确定多个第一关键帧,并基于所述多个第一关键帧,将所述目标视频数据的字幕信息划分为一个或多个第一字幕片段;针对每个第一字幕片段,确定对应的第一字幕向量;将所述第一字幕向量输入预先建立的数据模型,并接收所述数据模型输出本文档来自技高网...

【技术保护点】
1.一种视频处理的方法,其特征在于,所述方法包括:获取目标视频数据;从所述目标视频数据中,确定多个第一关键帧,并基于所述多个第一关键帧,将所述目标视频数据的字幕信息划分为一个或多个第一字幕片段;针对每个第一字幕片段,确定对应的第一字幕向量;将所述第一字幕向量输入预先建立的数据模型,并接收所述数据模型输出针对所述目标视频数据的内容描述信息。

【技术特征摘要】
1.一种视频处理的方法,其特征在于,所述方法包括:获取目标视频数据;从所述目标视频数据中,确定多个第一关键帧,并基于所述多个第一关键帧,将所述目标视频数据的字幕信息划分为一个或多个第一字幕片段;针对每个第一字幕片段,确定对应的第一字幕向量;将所述第一字幕向量输入预先建立的数据模型,并接收所述数据模型输出针对所述目标视频数据的内容描述信息。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个第一关键帧,将所述目标视频数据的字幕信息划分为一个或多个第一字幕片段的步骤包括:分别确定多个第一关键帧对应的第一播放时间点;针对每个第一关键帧,将所述第一关键帧与后一个第一关键帧对应的第一播放时间点组成第一播放时段;从所述目标视频数据的字幕信息中,提取出所述第一播放时段对应的字幕,得到一个或多个第一字幕片段。3.根据权利要求1或2所述的方法,其特征在于,所述从所述目标视频数据中,确定多个第一关键帧的步骤包括:确定所述目标视频数据中每个图像帧对应的第一特征向量;其中,所述每个图像帧按在所述目标视频数据中的播放顺序进行排列;根据所述第一特征向量,确定多个第一关键帧。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一特征向量,确定多个第一关键帧的步骤包括:针对相邻图像帧,计算所述第一特征向量的差异值;其中,所述相邻图像帧为相邻排列的两个图像帧;当检测到所述差异值大于预设差异值时,将所述差异值大于预设差异值对应的相邻图像帧中后一个图像帧,作为第一关键帧。5.根据权利要求1或2或4所述的方法,其特征在于,所述针对每个第一字幕片段,确定对应的第一字幕向量的步骤包括:分别对所述一个或多个第一字幕片段进行分词处理,并对所述分词处理后的第一字幕片段进行去重处理,得到一个或多个字词;针对每个第一字幕片段,以所述一个或多个字词的数量为向量长度,对所述第一字幕片段进行编码,得到对应的第一字幕向量。6.根据权利要求1所述的方法,其特征在于,在所述获取目标视频数据的步骤之前,还包括:获取样本视频数据;从所述样本视频数据中,确定多个第二关键帧,并基于所述多个第二关键帧,将所述样本视频数据的字幕信息划分为一个或多个第二字幕片段;针对每个第二字幕片段,确定对应的第二字幕向量和内容描述向量;采用基于注意力机制的循环神经网络,对所述第二字幕向量和所述内容描述向量进行训练,以建立数据模型。7.一种视频处理的装置,其特征在于,所述装置包括:目标视频数据获取模块,用于获取目标视频数据;第一字幕片段确定模块,用于...

【专利技术属性】
技术研发人员:马龙飞
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1