多语种语音转换文本方法、系统、存储介质及电子设备技术方案

技术编号：40769843 阅读：23 留言：0更新日期：2024-03-25 20:18

本发明专利技术提供一种多语种语音转换文本方法、系统、存储介质及电子设备，所述方法包括以下步骤：获取多个语种的语音音频信息和对应的语音转换文本请求和语音转换文本；基于所述语音音频信息、所述语音转换文本请求和所述语音转换文本训练多语种语音文本转换模型；基于训练好的多语种语音文本转换模型将待识别语音音频信息转换为对应的文本信息。本发明专利技术的多语种语音转换文本方法、系统、存储介质及电子设备能够将不同语种的语音转换为同一语种的文本信息，快速高效。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于深度学习的，特别是涉及一种多语种语音转换文本方法、系统、存储介质及电子设备。

技术介绍

1、语音识别技术应用在多种场景中，例如在智能对话场景中，通过对对话者的语音数据进行语音识别，进而转换为对应的文本信息，从而便于处理应用。

2、在实际使用中，不同对话者的语音可能涉及不同的语种，如中文、英文、德文。现有技术中，针对每个语种，需要采用专门的模型进行语音到文本之间的转换。在多语种的场景下，上述转换方法具有以下不足。

3、（1）不同的模型需要单独设计，会占用不同的硬件资源。

4、（2）各个任务需要分别处理，无法同时处理，导致效率低下。

技术实现思路

1、鉴于以上所述现有技术的缺点，本专利技术的目的在于提供一种多语种语音转换文本方法、系统、存储介质及电子设备，能够将不同语种的语音转换为同一语种的文本信息，快速高效。

2、第一方面，本专利技术提供一种多语种语音转换文本方法，所述方法包括以下步骤：获取多个语种的语音音频信息和对应的语音转换文...

【技术保护点】

1.一种多语种语音转换文本方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的多语种语音转换文本方法，其特征在于：获取所述语音转换文本请求和所述语音转换文本对应的文本嵌入信息包括以下步骤：

3.根据权利要求1所述的多语种语音转换文本方法，其特征在于：抽取所述语音音频信息的声学特征包括以下步骤：

4.根据权利要求1所述的多语种语音转换文本方法，其特征在于：对所述声学特征进行压缩处理，获取有效声学特征包括以下步骤：

5.根据权利要求1所述的多语种语音转换文本方法，其特征在于：对所述有效声学特征进行编码，获取编码声学特征包括以下步骤...

【技术特征摘要】

1.一种多语种语音转换文本方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的多语种语音转换文本方法，其特征在于：获取所述语音转换文本请求和所述语音转换文本对应的文本嵌入信息包括以下步骤：

3.根据权利要求1所述的多语种语音转换文本方法，其特征在于：抽取所述语音音频信息的声学特征包括以下步骤：

4.根据权利要求1所述的多语种语音转换文本方法，其特征在于：对所述声学特征进行压缩处理，获取有效声学特征包括以下步骤：

5.根据权利要求1所述的多语种语音转换文本方法，...

【专利技术属性】
技术研发人员：孔欧，
申请(专利权)人：上海蜜度科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人