视频摘要生成方法及装置制造方法及图纸

技术编号：32429205 阅读：28 留言：0更新日期：2022-02-24 18:35

本申请公开了一种视频摘要生成方法及装置。其中，该方法包括：获取视频文件；从上述视频文件中提取文字识别结果和图像识别结果；基于上述文字识别结果和上述图像识别结果生成视频摘要。本申请解决了现有的基于新闻文字生成视频内容摘要的方式没有兼顾图像、语音、文字等综合信息，难以生成高质量的视频摘要的技术问题。术问题。术问题。

全部详细技术资料下载

【技术实现步骤摘要】
视频摘要生成方法及装置

[0001]本申请涉及视频处理
，具体而言，涉及一种视频摘要生成方法及装置。

技术介绍

[0002]在当今社会，视频新闻依然是人们获取新闻信息的重要形式之一，但随着工作生活的节奏加快，人们能用来观看完整新闻的时间也越来越少，更多的人会倾向于直接去去查看一些关键信息，而非看完完整新闻或是在整个视频新闻中自行总结关键信息，这就对高质量视频新闻内容的摘要生成提出了需求。
[0003]但是现有的视频内容摘要生成的方式都存在一些缺陷，如下所介绍：现有方式一：人工方式生成新闻的图文摘要。优点：质量有可靠保证；缺点：人力成本高，时效性相对较低；现有方式二：基于人工智能的通用视频、影视视频或监控视频内容分析生成的图文摘要。优点：效率高，成本低；缺点：通用视频、影视视频或监控视频内容分析没有将新闻视频的重要特征以及目标结果要求纳入考量，所以生成视频不符合新闻图文摘要的要求。现有方式三：基于新闻文字生成图文摘要。优点：将新闻特性纳入考量，从而生成的文字摘要质量较高；缺点：现有方法主要都是基于新闻的文字进行生...

【技术保护点】

【技术特征摘要】
1.一种视频摘要生成方法，其特征在于，包括：获取视频文件；从所述视频文件中提取文字识别结果和图像识别结果；基于所述文字识别结果和所述图像识别结果生成视频摘要。2.根据权利要求1所述的方法，其特征在于，从所述视频文件中提取所述文字识别结果包括：采用光学文字提取方式从所述视频文件的字幕数据中提取第一识别结果；采用语音识别提取方式从所述视频文件的语音数据中提取第二识别结果；对所述第一识别结果和所述第二识别结果进行自然语言处理，得到所述文字识别结果。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：记录与所述文字识别结果对应的时间信息。4.根据权利要求3所述的方法，其特征在于，从所述视频文件中提取所述图像识别结果包括：基于所述文字识别结果和所述时间信息，从所述视频文件中提取所述图像识别结果。5.根据权利要求4所述的方法，其特征在于，基于所述文字识别结果和所述时间信息，从所述视频文件中提取所述图像识别结果包括：基于所述文字识别结果获取待适配文字信息；基于所述时间信息确定与所述待适配文字信息对应的时间点；根据所述时间点，从所述视频文件中提取与所述待适配文字信息关联的图像内容，得到所述图像识别结果。6.根据权利要求4所述的方法，其特征在于，基于所述文字识别结果和所述时间信息，从所述视频文件中提取所述图像识别结果包括：基于所述文字识别结果获取待适配文字信息；基于所述时间信息确定与所述待适配文字信息对应的时间段；根据所述时间段，从所述视频文件中提取与所述待适配文字信息关联的图像内容，得到所述图像识别结果。7.根据权利要求5或6所述的方法，其特征在于，从所述视频文件中提取与所述待适配文字信息关联的所述图像内容包括以下至少之一：采用人脸识别提取方式从所述视频文件中提取与所述待适配文...

【专利技术属性】
技术研发人员：李鹏宇，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人