基于大模型的视频融合与导出方法、装置、设备及介质制造方法及图纸

技术编号：42418378 阅读：19 留言：0更新日期：2024-08-16 16:34

本申请涉及视频流处理技术领域，公开了一种基于大模型的视频融合与导出方法、装置、设备及介质，所述方法包括通过A I语音识别模型对初始音频进行语音识别，提取关键词；将初始视频进行剪辑，生成视频片段，并将关键词作为视频标签；基于视频标签生成融合视频；基于时间戳信息、视频标签和用户需求，生成视频导出方案。通过上述方式，本申请通过AI语音识别模型根据初始视频中的音频数据进行语音识别，将初始视频进行剪辑，并添加标签，提高了剪辑后每个视频片段的标签语音准确性。根据视频标签将视频片段融合，并根据用户的需求以及融合后的视频时间戳，提供对于融合视频的分段导出方案，通过AI大模型提高了视频融合与视频剪辑导出的便捷性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及视频流处理，尤其涉及一种基于大模型的视频融合与导出方法、装置、设备及介质。

技术介绍

1、随着社交媒体、在线视频平台的普及，用户对高质量、富有创意的视频内容的需求逐渐增加。在视频生产过程中，一般会涉及到视频剪辑。当前视频剪辑一般通过视频剪辑软件或ai自动化剪辑实现。a i自动化剪辑是利用人工智能技术，特别是深度学习和计算机视觉算法，来实现自动化视频剪辑和编辑的过程。这一技术的目标是通过机器学习算法使得视频制作更加高效、个性化，并减轻人工编辑的负担。因此，如何通过ai大模型提高视频融合与视频剪辑导出的便捷性成为了目前亟待解决的技术问题。

技术实现思路

1、本申请提供了一种基于大模型的视频融合与导出方法、装置、设备及介质，以通过ai大模型提高视频融合与视频剪辑导出的便捷性。

2、第一方面，本申请提供了一种基于大模型的视频融合与导出方法，所述方法包括：

3、通过预设ai语音识别模型对初始视频中的初始音频进行语音识别，提取所述初始音频的至少一组关键词；

>4、通过各所述关键本文档来自技高网...

【技术保护点】

1.一种基于大模型的视频融合与导出方法，其特征在于，包括：

2.根据权利要求1所述的基于大模型的视频融合与导出方法，其特征在于，所述基于各所述视频标签，将各所述视频片段进行多模态融合，生成融合视频，包括：

3.根据权利要求2所述的基于大模型的视频融合与导出方法，其特征在于，所述基于各所述视频标签，将各所述视频片段进行多模态融合，生成融合视频，包括：

4.根据权利要求1所述的基于大模型的视频融合与导出方法，其特征在于，所述通过预设AI语音识别模型对初始视频中的初始音频进行语音识别，提取所述初始音频的至少一组关键词之前，包括：

<...

【技术特征摘要】

1.一种基于大模型的视频融合与导出方法，其特征在于，包括：

4.根据权利要求1所述的基于大模型的视频融合与导出方法，其特征在于，所述通过预设ai语音识别模型对初始视频中的初始音频进行语音识别，提取所述初始音频的至少一组关键词之前，包括：

5.根据权利要求1所述的基于大模型的视频融合与导出方法，其特征在于，所述通过预设ai语音识别模型对初始视频中的初始音频进行语音识别，提取所述初始音频的至...

【专利技术属性】
技术研发人员：王书怡，
申请(专利权)人：极速视效厦门人工智能有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人