一种基于视频大数据的音频转视频的方法技术

技术编号：40484742 阅读：19 留言：0更新日期：2024-02-26 19:17

本发明专利技术公开了一种基于视频大数据的音频转视频的方法，包括利用基于深度学习技术的识别模型，提取并结构化存储视频素材中包含的信息，构建素材库；利用基于深度学习的语音识别技术提取音频中的文字信息，利用自然语言处理技术对文字信息进行关键信息提取，并使用语音合成技术将文字信息合成旁白和字幕信息；利用自然语言处理技术和深度学习技术，训练关键信息匹配模型；基于训练好的关键信息匹配模型，根据提取的关键信息在素材库中检索出最匹配的视频素材；将旁白和字幕信息与最匹配的视频素材进行整合渲染，生成视频结果。优点是：无需创作者打字编写文案，只需将想法录音，就可以通过语音识别技术识别出其中的文字，创作门槛低，节省时间精力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频处理，尤其涉及一种基于视频大数据的音频转视频的方法。

技术介绍

1、对于内容创作者而言，带有动态图像和声音的视频是最能表达其意图的方式。传统的视频创作，需要经过人工撰写文案，编辑脚本、收集素材、视频剪辑、配旁白、配背景音乐等步骤，不仅存在一定的技术门槛，还会耗费创作者的大量时间与精力。

技术实现思路

1、本专利技术的目的在于提供一种基于视频大数据的音频转视频的方法，从而解决现有技术中存在的前述问题。

2、为了实现上述目的，本专利技术采用的技术方案如下：

3、一种基于视频大数据的音频转视频的方法，包括如下步骤，

4、s1、素材库构建：

5、收集海量视频素材，利用基于深度学习技术的识别模型，提取视频素材中包含的信息，将提取出的信息进行结构化存储，构建素材库；

6、s2、音频信息提取：

7、利用基于深度学习的语音识别技术提取创作者上传的音频中的文字信息，利用自然语言处理技术对文字信息进行关键信息提取，并使用...

【技术保护点】

1.一种基于视频大数据的音频转视频的方法，其特征在于：包括如下步骤，

2.根据权利要求1所述的基于视频大数据的音频转视频的方法，其特征在于：步骤S1具体包括如下内容，

3.根据权利要求2所述的基于视频大数据的音频转视频的方法，其特征在于：利用训练好的识别模型识别关键帧图像中存在的信息，包括人脸识别、对象识别和OCR识别；具体为，

4.根据权利要求1所述的基于视频大数据的音频转视频的方法，其特征在于：利用基于深度学习的语音识别技术提取创作者上传的音频中的文字信息，具体包括如下内容，

5.根据权利要求1所述的基于视频大数据的音频转视频的方法，其...

【技术特征摘要】

1.一种基于视频大数据的音频转视频的方法，其特征在于：包括如下步骤，

2.根据权利要求1所述的基于视频大数据的音频转视频的方法，其特征在于：步骤s1具体包括如下内容，

3.根据权利要求2所述的基于视频大数据的音频转视频的方法，其特征在于：利用训练好的识别模型识别关键帧图像中存在的信息，包括人脸识别、对象识别和ocr识别；具体为，

5.根据权利要求1所...

【专利技术属性】
技术研发人员：杜宇轩，张华伟，
申请(专利权)人：新壹北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人