视频生成方法、装置、设备及介质制造方法及图纸

技术编号：34844290 阅读：20 留言：0更新日期：2022-09-08 07:42

本申请提供一种视频生成方法、装置、设备及介质，该视频生成方法包括：响应于客户端的视频生成请求，获取与推荐对象相关的原始视频；对原始视频进行多模态特征识别，得到原始视频中图像帧的图像识别信息和原始视频中语音对应的文本片段；根据图像识别信息和文本片段，对原始视频进行处理，得到至少一个目标视频，目标视频为原始视频中的一个视频片段或者为原始视频中多个视频片段的组合。从而，基于原始视频实现目标视频的自动提取，无需用户手动将原始视频剪辑成一个或多个目标视频，提高了视频生成效率，降低了视频生成成本，同时在目标视频的提取过程中利用了多模态特征识别得到的图像识别信息和文本片段，确保了视频生成质量。成质量。成质量。

全部详细技术资料下载

【技术实现步骤摘要】
视频生成方法、装置、设备及介质

[0001]本申请涉及计算机
，尤其涉及一种视频生成方法、装置、设备及介质。

技术介绍

[0002]近年来，随着移动互联网技术及相关基础建设的飞速发展，移动互联网用户越来越习惯于观看短视频，与短视频相关的应用程序占据了移动互联网用户上网冲浪的大部分时间。在此背景下，电商场景下与短视频相关的业务快速发展，短视频在线上为商家带来了大量的免费带货流量。
[0003]相关技术中，商家使用拍摄时长较长的原始视频，在剪辑工具中手动对长达数小时的原始视频进行复杂的剪辑操作，这个过程耗费剪辑人员大量时间，导致短视频的生产效率低且生产成本较高，进而使得部分商家受成本限制无法开展短视频运营业务或减少短视频运营业务。
[0004]因此，如何高效低成本地生产出优质的短视频，是目前亟需解决的问题。

技术实现思路

[0005]本申请提供一种视频生成方法、装置、设备及介质，用以解决如何高效低成本地生产出优质的短视频的问题。
[0006]第一方面，本申请实施例提供一种视频生成方法，应用于服务器，包括：响应于客户端的视频生成请求，获取与推荐对象相关的原始视频；对原始视频进行多模态特征识别，得到原始视频中图像帧的图像识别信息和原始视频中语音对应的文本片段；根据图像识别信息和文本片段，对原始视频进行处理，得到至少一个目标视频，目标视频为原始视频中的一个视频片段或者为原始视频中多个视频片段的组合。
[0007]第二方面，本申请实施例提供一种视频生成方法，应用于客户端，包括...

【技术保护点】

【技术特征摘要】
1.一种视频生成方法，应用于服务器，其特征在于，包括：响应于客户端的视频生成请求，获取与推荐对象相关的原始视频；对所述原始视频进行多模态特征识别，得到所述原始视频中图像帧的图像识别信息和所述原始视频中语音对应的文本片段；根据所述图像识别信息和所述文本片段，对所述原始视频进行处理，得到至少一个目标视频，所述目标视频为所述原始视频中的一个视频片段或者为所述原始视频中多个视频片段的组合。2.根据权利要求1所述的视频生成方法，其特征在于，所述根据所述图像识别信息和所述文本片段，对所述原始视频进行处理，得到至少一个目标视频，包括：根据所述图像识别信息，对所述原始视频中的推荐对象进行类别预测，得到所述原始视频中的推荐对象所属的目标类别；根据所述文本片段和所述目标类别，对所述文本片段进行有效讲解信息的识别，得到包含有效讲解信息的候选文本片段；根据所述候选文本片段，对所述原始视频进行处理，得到所述目标视频。3.根据权利要求2所述的视频生成方法，其特征在于，预先构建知识图谱，所述知识图谱中包括至少一个类别下的推荐对象的图像，所述根据所述图像识别信息，对所述原始视频中的推荐对象进行类别预测，得到所述原始视频中的推荐对象所属的目标类别，包括：将所述知识图谱中至少一个类别下的推荐对象的图像与所述图像识别信息进行图像匹配，根据图像匹配结果，确定所述目标类别。4.根据权利要求3所述的视频生成方法，其特征在于，所述知识图谱中还包括至少一个类别下的推荐对象的属性，所述根据所述文本片段和所述目标类别，对所述文本片段进行有效讲解信息的识别，得到包含有效讲解信息的候选文本片段，包括：在所述知识图谱中，获取所述目标类别下推荐对象的属性；将所述文本片段与所述目标类别下推荐对象的属性进行文本匹配，得到包含所述目标类别下推荐对象的属性的文本片段，确定所述候选文本片段为包含所述目标类别下推荐对象的属性的文本片段。5.根据权利要求2至4中任一项所述的视频生成方法，其特征在于，所述根据所述候选文本片段，对所述原始视频进行处理，得到所述目标视频，包括：根据内容质量要求，对所述候选文本片段进行筛选；根据筛选后的候选文本片段，对所述原始视频进行处理，得到所述目标视频。6.根据权利要求2至4中任一项所述的视频生成方法，其特征在于，所述候选文本片段标注有时间信息，所述根据所述候选文本片段，对所述原始视频进行处理，得到所述目标视频，包括：根据所述图像识别信息和所述候选文本片段上标注的时间信息...

【专利技术属性】
技术研发人员：贺欣，谢佳雯，陈建宇，吴春松，刘延朋，常小军，熊成，刘成，赵翊腾，姜永刚，李金，陈炳辉，包季真，黄博翔，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人