分布式语音处理系统及方法技术方案

技术编号:28059657 阅读:62 留言:0更新日期:2021-04-14 13:35
提供一种分布式语音处理系统及方法。该系统包括:网络中的多个节点设备,其中每个节点设备包括处理器、存储器、通信模块及声音处理模块,至少一个节点设备包括声音采集模块;其中声音采集模块配置为采集音频信号;声音处理模块配置为对音频信号进行预处理以得到第一声音预处理结果;通信模块配置为将第一声音预处理结果发送到网络中的一个或多个节点设备;通信模块还配置为从网络接收来自至少一个其他节点设备的一个或多个第二声音预处理结果;及声音处理模块还配置为基于第一声音预处理结果和/或一个或多个第二声音预处理结果执行语音识别。本申请实现了去中心化的设计,提高了语音识别的效率、稳定性和鲁棒性。稳定性和鲁棒性。稳定性和鲁棒性。

【技术实现步骤摘要】
分布式语音处理系统及方法


[0001]本申请涉及分布式语音处理领域,尤其涉及一种分布式语音处理系统及方法。

技术介绍

[0002]语音识别技术和关键词识别技术日趋成熟,且在市场中的应用越来越广泛,比如儿童玩具、教育产品、智能家居等产品中都加入了语音识别功能,实现语音交互控制的功能。
[0003]当前的语音识别有两种常见的方法,一种是基于单个设备的本地识别,另一种是基于本地识别结合服务器云端的识别。
[0004]对于第一种方法,智能家居市场上常用的单个设备实现本地语音控制,其语音识别过程是将原始语音采集到一个设备,在这个设备上进行计算获得识别结果。这种方法在应用过程中,如果用户在空间环境中移动或需要跨房间识别时,受拾音距离的限制,常常不能顺利完成语音识别,从而导致出现不能识别或识别效果差的情况。
[0005]对于第二种方法,市面上通常通过智能音箱或者智能网关等进行语音识别。这些设备作为控制中枢,同时也是语音识别的唯一入口。设备必须先连接到互联网,然后接入相应的云端服务器也需要连接到互联网。这些设备从云端获取语音识别结果,进本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分布式语音处理系统,其特征在于,包括:网络中的多个节点设备,其中每个节点设备包括处理器、存储器、通信模块以及声音处理模块,且所述多个节点设备中的至少一个节点设备包括声音采集模块;其中所述声音采集模块配置为采集音频信号;所述声音处理模块配置为对所述音频信号进行预处理以得到第一声音预处理结果;所述通信模块配置为将所述第一声音预处理结果发送到所述网络中的一个或多个节点设备;所述通信模块还配置为从所述网络接收来自至少一个其他节点设备的一个或多个第二声音预处理结果;及所述声音处理模块还配置为基于所述第一声音预处理结果和/或所述一个或多个第二声音预处理结果执行语音识别。2.根据权利要求1所述的分布式语音处理系统,其特征在于,所述通信模块还配置为将所述第一语音识别结果发送到所述网络中的一个或多个节点设备;所述通信模块还配置为从所述网络接收来自至少一个其他节点设备的一个或多个第二语音识别结果;及所述声音处理模块还配置为基于所述第一语音识别结果和所述一个或多个第二语音识别结果执行语音识别以得到最终语音识别结果。3.根据权利要求1所述的分布式语音处理系统,其特征在于,所述第一声音预处理结果和所述一个或多个第二声音预处理结果的每个包括声音特征值、声音质量及声音时间信息。4.根据权利要求3所述的分布式语音处理系统,其特征在于,所述声音特征值为所述音频信号的MFCC特征值或PLP特征值。5.根据权利要求3所述的分布式语音处理系统,其特征在于,所述声音质量包括所述音频信号的信噪比和幅度。6.根据权利要求3所述的分布式语音处理系统,其特征在于,所述声音时间信息包括所述音频信号的开始时间和结束时间,或所述音频信号的开始时间和持续时间。7.根据权利要求3所述的分布式语音处理系统,其特征在于,所述第一声音预处理结果和所述一个或多个第二声音预处理结果的每个还包括所述音频信号的递增序号。8.根据权利要求3所述的分布式语音处理系统,其特征在于,所述声音处理模块还配置为对于所述第一声音预处理结果和所述一个或多个第二声音预处理结果中的每个,判断其声音质量是否超过预定阈值,若否,则丢弃该语音预处理结果。9.根据权利要求3所述的分布式语音处理系统,其特征在于,所述声音处理模块还配置为在所述第一声音预处理结果和所述一个或多个第二声音预处理结果中,选取一个或多个声音质量最高的声音预处理结果进行语音识别以得到所述第一语音识别结果。10.根据权利要求2所述的分布式语音处理系统,其特征在...

【专利技术属性】
技术研发人员:毛建鑫
申请(专利权)人:乐鑫信息科技上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1