一种基于语音识别的视频合成方法、系统及存储介质技术方案

技术编号：42573050 阅读：15 留言：0更新日期：2024-08-29 00:38

本发明专利技术涉及视频合成技术领域，具体地说，涉及一种基于语音识别的视频合成方法、系统及存储介质。其包括以下步骤：采集用户输入的音频数据，对音频数据进行语音识别，获取语音文本，然后对语音文本进行类型筛分，获取形容语句和语气语句；通过将采集的音频数据进行类型筛分，将语气词和形容词挑选，减少了手动处理音频和文本的时间，提高了视频制作的效率，再通过将形容语句进行分段筛选关联值最高的视频，并以第一个视频为主体将第二个视频进行画质修改，从而进行视频拼接，使得视频之间的关联性较强，而且整体视频的主题更加契合。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频合成，具体地说，涉及一种基于语音识别的视频合成方法、系统及存储介质。

技术介绍

1、在视频合成领域，需要技术人员在网络中寻找对应的网络资源，将其进行拼接从而合成视频；

2、目前在采用语音识别合成视频过程中，当用户一次性输入音频较长时，模型需要能够理解上下文关系，以确保生成的文本能够准确反映语音内容，当文本里面穿插语气词时，会导致模型对语句分段和识别错误，导致合成的场景和用户需求相差太大，而且用户输入音频中可能会出现多场景，导致模型生成多个关联性较低的视频进行合成，造成输出的视频整体场景衔接性较差，合成的视频质量较低。

3、鉴于此，本专利技术提供了一种基于语音识别的视频合成方法、系统及存储介质。

技术实现思路

1、本专利技术的目的在于提供一种基于语音识别的视频合成方法、系统及存储介质，以解决上述
技术介绍
中提出的问题。

2、为实现上述目的，本专利技术目的在于，提供了一种基于语音识别的视频合成方法，包括以下步骤：

3、s1、采集用...

【技术保护点】

1.一种基于语音识别的视频合成方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述S1通过物联网和麦克风建立数据传输通道，从而利用麦克风采集用户输入的音频数据。

3.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述S1的步骤如下：

4.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述S2的步骤如下：

5.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述S3的公式如下：

6.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：...

【技术特征摘要】

1.一种基于语音识别的视频合成方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述s1通过物联网和麦克风建立数据传输通道，从而利用麦克风采集用户输入的音频数据。

3.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述s1的步骤如下：

4.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述s2的步骤如下：

5.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述s3的公式如下：

6.根据权利要求1所述的基于语音识别的视频合成方法，其特征在于：所述s3在视频拼接这个过...

【专利技术属性】
技术研发人员：陈琰，宋仁骥，贺林，
申请(专利权)人：深圳智慧保业科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人