一种语音处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品制造方法及图纸

技术编号:42788900 阅读:22 留言:0更新日期:2024-09-21 00:46
本申请提供了一种语音处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取语音数据的场景类型,并获取与场景类型对应的场景条件编码,对语音数据进行编码处理,得到语音数据的语音编码,基于场景条件编码对语音编码进行语音转动作变换处理,得到对应语音数据的动作编码,对动作编码进行解码处理,得到符合场景类型且与语音数据匹配的动作数据。通过本申请,能够通过与场景类型对应的场景条件编码灵活控制语音转动作的生成,使得生成得到的动作数据可以适配对应的场景类型,优化生成效果。

【技术实现步骤摘要】

本申请涉及人工智能技术,尤其涉及一种语音处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品


技术介绍

1、随着人工智能技术的发展,动作模型的应用场景也日益增多,例如,商场中的舞蹈机器人模型,演讲台上的演讲机器人模型等。控制动作模型执行动作的方式往往是用户通过语音输入,使得语音转动作模型输出该语音对应的动作。由于对于不同场景中,对应想用语音的动作往往不尽相同,因此,在相关技术中,针对不同场景,需要使用不同的语音转动作模型来进行控制。


技术实现思路

1、本申请实施例提供一种语音处理的方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够通过与场景类型对应的场景条件编码灵活控制语音转动作的生成,使得生成得到的动作数据可以适配对应的场景类型,优化生成效果。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种语音处理的方法,包括:

4、获取语音数据的场景类型,并获取与所述场景类型对应的场景条件编码;

5、对语音数据进行编码处理,得到所述本文档来自技高网...

【技术保护点】

1.一种语音处理的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述场景条件编码包括语音场景条件编码;

3.根据权利要求1所述的方法,其特征在于,所述场景条件编码包括动作场景条件编码;

4.根据权利要求1所述的方法,其特征在于,所述场景条件编码包括语音场景条件编码以及动作场景条件编码;

5.根据权利要求4所述的方法,其特征在于,所述基于所述语音场景条件编码,对所述语音编码进行仿射变换处理,得到语音场景编码,包括:

6.根据权利要求1所述的方法,其特征在于,所述语音处理的方法是通过调用语音转动作模型实...

【技术特征摘要】

1.一种语音处理的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述场景条件编码包括语音场景条件编码;

3.根据权利要求1所述的方法,其特征在于,所述场景条件编码包括动作场景条件编码;

4.根据权利要求1所述的方法,其特征在于,所述场景条件编码包括语音场景条件编码以及动作场景条件编码;

5.根据权利要求4所述的方法,其特征在于,所述基于所述语音场景条件编码,对所述语音编码进行仿射变换处理,得到语音场景编码,包括:

6.根据权利要求1所述的方法,其特征在于,所述语音处理的方法是通过调用语音转动作模型实现的,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,在基于属于所述目标场景类型的...

【专利技术属性】
技术研发人员:叶志凌张良国
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1