一种语音识别方法、装置、系统制造方法及图纸

技术编号：24614916 阅读：22 留言：0更新日期：2020-06-24 01:53

本申请实施例公开一种语音识别方法、装置、系统，方法包括：对接收到的由麦克风阵列系统发送的音频数据进行回声消除；将回声消除后得到的周围声源数据输入至一语音识别模型中以进行语音识别，同时根据一信噪比计算方法对周围声源数据进行信噪比计算；对语音识别结果和信噪比计算结果进行判断，当语音识别结果与预存储的常用沟通用语文本数据中的至少一种相同并且信噪比计算结果大于信噪比阈值时，将语音识别结果和信噪比计算结果进行加权处理；判断加权结果是否大于预设值，当大于时，进行声源定位并根据定位结果生成语音提示并将语音提示发送至耳机。本申请可以识别周围是否有他人在对耳机佩戴者讲话，从而进行提醒，提高了沟通效率。

A speech recognition method, device and system

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法、装置、系统
本专利技术属于声学领域，尤其涉及一种语音识别方法、装置、系统。
技术介绍
由于耳机具有方便使用、自由沟通、提高效率等优点，已经成为许多“移动群族”日常生活中不可缺少的沟通工具。但随着日常生活的长期使用，使用耳机造成的“交流误解”变成了人们日常生活中的痛点。其具体表现在，当使用者佩戴耳机进行聊天时，容易沉浸在电话中，因此会对旁人视而不见，当周围人有意沟通时，由于使用者的主要集中在聊天内容上，无法注意到他人的话语，即他人很难“唤醒”使用者，容易造成场面尴尬、产生误会，降低沟通效率。
技术实现思路
为了解决现有技术的问题，本专利技术提出了一种语音识别方法、装置、系统，本方法通过对周围声源进行语音识别和信噪比计算，当语音识别结果和信噪比计算结果满足预设条件时，即表明周围有人在与耳机佩戴者进行沟通，从而提示耳机佩戴者，提高了沟通效率，减少沟通成本和不必要的误会，让人与人之间的交流更加和谐。本专利技术实施例提供的具体技术方案如下：第一方面，本专利技术提供一种语音识别方法，所述方法包括：对接收到的由麦克风阵列系统发送的音频数据进行回声消除以得到周围声源数据；将所述周围声源数据输入至一语音识别模型中以进行语音识别，同时根据一信噪比计算方法对所述周围声源数据进行信噪比计算；对语音识别结果和信噪比计算结果进行判断，当所述语音识别结果与预存储的常用沟通用语文本数据的至少一种相同并且信噪比计算结果大于信噪比阈值时，将所述语音识别结果和信噪比计算结果进行...

【技术保护点】
1.一种语音识别方法，其特征在于，所述方法包括：/n对接收到的由麦克风阵列系统发送的音频数据进行回声消除以得到周围声源数据；/n将所述周围声源数据输入至一语音识别模型中以进行语音识别，同时根据一信噪比计算方法对所述周围声源数据进行信噪比计算；/n对语音识别结果和信噪比计算结果进行判断，当所述语音识别结果与预存储的常用沟通用语文本数据中的至少一种相同并且信噪比计算结果大于信噪比阈值时，将所述语音识别结果和信噪比计算结果进行加权处理；/n判断加权结果是否大于预设值，当大于时，获取与所述加权结果相对应的目标声源数据并根据所述目标声源数据计算目标声源位置信息；/n根据所述目标声源位置信息生成语音提示并将所述语音提示发送至耳机。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：
对接收到的由麦克风阵列系统发送的音频数据进行回声消除以得到周围声源数据；
将所述周围声源数据输入至一语音识别模型中以进行语音识别，同时根据一信噪比计算方法对所述周围声源数据进行信噪比计算；
对语音识别结果和信噪比计算结果进行判断，当所述语音识别结果与预存储的常用沟通用语文本数据中的至少一种相同并且信噪比计算结果大于信噪比阈值时，将所述语音识别结果和信噪比计算结果进行加权处理；
判断加权结果是否大于预设值，当大于时，获取与所述加权结果相对应的目标声源数据并根据所述目标声源数据计算目标声源位置信息；
根据所述目标声源位置信息生成语音提示并将所述语音提示发送至耳机。

2.根据权利要求1所述的方法，其特征在于，在根据一信噪比计算方法对所述周围声源数据进行信噪比计算之前，所述方法还包括：
对所述周围声源数据进行傅里叶变换以得到周围声源数据的能量；
根据预设的能量阈值，获取大于所述能量阈值的能量所对应的周围声源数据。

3.根据权利要求1所述的方法，其特征在于，获取与所述加权结果相对应的目标声源数据并根据所述目标声源数据计算目标声源位置信息具体包括：
在所述周围声源数据中确定与所述加权结果相对应的目标声源数据，所述目标声源数据由安装在左、右两个耳机上的麦克风阵列系统发送得到；
对所述目标声源数据进行声源定位以得到目标声源位置信息。

4.根据权利要求1所述的方法，其特征在于，所述语音识别模型的获取方法包括：
构建样本语音库；所述样本语音库为不同距离和不同方位的周围用户相对于目标用户所发出的历史语音数据以及与所述历史语音数据相对应的历史文本数据，所述历史语音数据包括常用沟通用语语音数据，所述历史文本数据包括常用沟通用语文本数据，所述常用沟通用语包括目标用户的名字、称谓、周围用户与目标用户之间的聊天常用语；
根据所述样本语音库对一基础模型进行训练以得到所述语音识别模型。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：
根据一信噪比计算方法对所述样本语音库中的每一条历史语音数据进行信噪比计算，得到历史信噪比值；
根据所述历史信噪比值确定信噪比阈值。

6.根据权利要求1～5任意一项所述的方法，其特征在于，在对音频数据进行回声消除得到周围声源数据后，所述方法还包括：
对所述周围声源数据进行降噪处理。

7.一种语音识别装置，其特征在于，包括：
分离模块，用于对接收到的由麦克...

【专利技术属性】
技术研发人员：刘兵兵，包飞，刘淼泽，樊锅旭，倪合强，
申请(专利权)人：苏宁云计算有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人