语音处理方法、存储介质及系统技术方案

技术编号：38930776 阅读：11 留言：0更新日期：2023-09-25 09:35

本申请公开了一种语音处理方法、存储介质及系统。其中，该方法包括：获取待处理的语音信息，其中，待处理的语音信息包括：多个语音片段；对多个语音片段进行特征转换，得到转换结果；对转换结果进行特征解码，得到解码结果；基于解码结果确定目标语音处理结果。本申请解决了相关技术中对语音数据流进行处理时的处理效率低、识别准确性差的技术问题。识别准确性差的技术问题。识别准确性差的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、存储介质及系统

[0001]本申请涉及计算机
，具体而言，涉及一种语音处理方法、存储介质及系统。

技术介绍

[0002]语音处理是使用计算机对人类语言进行分析、识别、合成和理解的技术，随着智能化时代的到来，语音处理的应用领域越来越广泛，其对于提供更加智能化的人机交互体验具有重要意义。相关技术中采用不同的语音处理模型对语音数据流进行处理，而各种不同的语音处理模型由于构造原理不同，在进行语音处理时，均存在不同程度的缺陷，从而导致语音数据流的处理效率低下、识别准确性差。
[0003]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请实施例提供了一种语音处理方法、存储介质及系统，以至少解决相关技术中对语音数据流进行处理时的处理效率低、识别准确性差的技术问题。
[0005]根据本申请实施例的一个方面，提供了一种语音处理方法，包括：获取待处理的语音信息，其中，所述待处理的语音信息包括：多个语音片段；对所述多个语音片段进行特征转换，得到转换结果；对所述转换结果进行特征解码，得到解码结果；基于所述解码结果确定目标语音处理结果。
[0006]根据本申请实施例的另一方面，还提供了一种语音处理方法，包括：获取待识别的语音信息，其中，所述待识别的语音信息包括：多个语音片段；对所述多个语音片段进行特征转换，得到多个语音特征向量；对所述多个语音特征向量进行特征解码，得到多个文本片段；基于所述多个文本片段确定目标语音识别结果。
[0007]根据本申请实...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，其特征在于，包括：获取待处理的语音信息，其中，所述待处理的语音信息包括：多个语音片段；对所述多个语音片段进行特征转换，得到转换结果；对所述转换结果进行特征解码，得到解码结果；基于所述解码结果确定目标语音处理结果。2.根据权利要求1所述的语音处理方法，其特征在于，对所述多个语音片段进行特征转换，得到所述转换结果包括：在连续多个时刻，采用语音处理大模型依次对所述多个语音片段进行语音编码或者语音分词，得到多个语音特征向量，其中，所述多个时刻与所述多个语音片段一一对应。3.根据权利要求2所述的语音处理方法，其特征在于，对所述转换结果进行特征解码，得到所述解码结果包括：在所述连续多个时刻，采用所述语音处理大模型依次对所述多个语音特征向量进行特征解码，得到多个解码片段。4.根据权利要求3所述的语音处理方法，其特征在于，在所述连续多个时刻，采用所述语音处理大模型依次对所述多个语音特征向量进行特征解码，得到所述多个解码片段包括：在所述连续多个时刻，采用所述语音处理大模型依次对所述多个语音特征向量和上下文信息进行特征解码，得到所述多个解码片段，其中，所述上下文信息由所述多个语音特征向量中当前时刻语音特征向量相关联的历史时刻语音片段与历史时刻解码片段确定。5.根据权利要求4所述的语音处理方法，其特征在于，在所述连续多个时刻，采用所述语音处理大模型依次对所述多个语音特征向量和所述上下文信息进行特征解码，得到所述多个解码片段包括：在所述连续多个时刻，采用所述语音处理大模型依次对所述当前时刻语音特征向量、所述当前时刻语音特征向量相邻的前一时刻语音片段以及所述当前时刻语音特征向量相邻的前一时刻解码片段进行特征解码以得到当前时刻解码片段，直至所述多个语音特征向量全部解码完毕，得到所述多个解码片段。6.根据权利要求2所述的语音处理方法，其特征在于，所述语音处理大模型包括：特征转换模型与特征解码模型。7.根据权利要求6所述的语音处理方法，其特征在于，所述特征解码模型为多模态语言模型。8.根据权利要求7所述的语音处理方法，其特征在于，对所述转换结果进行特征解码，得到所述解码结果包括：采用所述多模态语言模型对所述转换结果进行特征解码，得到所述解码结果；或者，采用所述多模态语言模型对所述转换结果进行非特征解码，得到所述解码结果。9.根据权利要求1所述的语音处理方法，其特征在于，通过终端设备提供一图形用户界面，所述图形用户界面所显示的内容至少部分地包含一语音处理场景，所述语音处理方法还包括：响应...

【专利技术属性】
技术研发人员：陈谦，郑斯奇，张仕良，张庆林，王雯，
申请(专利权)人：杭州阿里巴巴飞天信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人