一种基于语音识别的视频合成方法、系统及存储介质技术方案

技术编号:42573050 阅读:15 留言:0更新日期:2024-08-29 00:38
本发明专利技术涉及视频合成技术领域,具体地说,涉及一种基于语音识别的视频合成方法、系统及存储介质。其包括以下步骤:采集用户输入的音频数据,对音频数据进行语音识别,获取语音文本,然后对语音文本进行类型筛分,获取形容语句和语气语句;通过将采集的音频数据进行类型筛分,将语气词和形容词挑选,减少了手动处理音频和文本的时间,提高了视频制作的效率,再通过将形容语句进行分段筛选关联值最高的视频,并以第一个视频为主体将第二个视频进行画质修改,从而进行视频拼接,使得视频之间的关联性较强,而且整体视频的主题更加契合。

【技术实现步骤摘要】

本专利技术涉及视频合成,具体地说,涉及一种基于语音识别的视频合成方法、系统及存储介质


技术介绍

1、在视频合成领域,需要技术人员在网络中寻找对应的网络资源,将其进行拼接从而合成视频;

2、目前在采用语音识别合成视频过程中,当用户一次性输入音频较长时,模型需要能够理解上下文关系,以确保生成的文本能够准确反映语音内容,当文本里面穿插语气词时,会导致模型对语句分段和识别错误,导致合成的场景和用户需求相差太大,而且用户输入音频中可能会出现多场景,导致模型生成多个关联性较低的视频进行合成,造成输出的视频整体场景衔接性较差,合成的视频质量较低。

3、鉴于此,本专利技术提供了一种基于语音识别的视频合成方法、系统及存储介质。


技术实现思路

1、本专利技术的目的在于提供一种基于语音识别的视频合成方法、系统及存储介质,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术目的在于,提供了一种基于语音识别的视频合成方法,包括以下步骤:

3、s1、采集用户输入的音频数据,对本文档来自技高网...

【技术保护点】

1.一种基于语音识别的视频合成方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述S1通过物联网和麦克风建立数据传输通道,从而利用麦克风采集用户输入的音频数据。

3.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述S1的步骤如下:

4.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述S2的步骤如下:

5.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述S3的公式如下:

6.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:...

【技术特征摘要】

1.一种基于语音识别的视频合成方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述s1通过物联网和麦克风建立数据传输通道,从而利用麦克风采集用户输入的音频数据。

3.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述s1的步骤如下:

4.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述s2的步骤如下:

5.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述s3的公式如下:

6.根据权利要求1所述的基于语音识别的视频合成方法,其特征在于:所述s3在视频拼接这个过...

【专利技术属性】
技术研发人员:陈琰宋仁骥贺林
申请(专利权)人:深圳智慧保业科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1