一种远场语音识别方法、语音识别模型训练方法和服务器技术

技术编号：23346369 阅读：21 留言：0更新日期：2020-02-15 04:54

本申请提供了一种远场语音识别方法、语音识别模型训练方法和服务器，其中，该远场语音识别方法包括：获取语音数据；确定所述语音数据是否为远场语音数据；在确定所述语音数据为远场语音数据的情况下，通过语音识别模型对所述语音数据进行识别，其中，所述语音识别模型是根据通过语音数据的时间维度信息和频率维度信息，对所述语音数据的语音特征进行频带能量规整后得到的语音特征进行训练后得到的。利用本申请实施例提供的技术方案，因为在对频带能量规整过程中引入了时间维度信息和频率维度信息，从而可以弱化时间和频率对语音识别准确度的影响，基于该语音识别模型进行远程语音识别，可以有效提升识别准确率，从而达到了有效提升语音识别模型的识别准确率的技术效果。

A far-field speech recognition method, speech recognition model training method and server

全部详细技术资料下载

【技术实现步骤摘要】
一种远场语音识别方法、语音识别模型训练方法和服务器
本申请属于互联网
，尤其涉及一种远场语音识别方法、语音识别模型训练方法和服务器。
技术介绍
远场语音识别是语音交互领域的重要技术，通过远场语音识别技术可以识别出远距离的声音(例如，可以识别到1m到5m内的语音)。远场语音识别主要应用在智能家居领域，例如，可以应用在智能音箱、智能电视等设备中，也可以应用在会议转录等领域中。然而，由于在真实环境中，一般会存在大量的噪声、多径反射和混响等干扰问题，从而导致拾取的声音信号的质量下降。对于远场语音识别而言，导致识别准确率下降的主要原因就是由于距离引起的语音能量衰减。如何有效减少语音能量衰减导致的语音模型识别准确度高的问题，目前尚未提出有效的解决方案。
技术实现思路
本申请目的在于提供一种远场语音识别方法、语音识别模型训练方法和服务器，以达到提升语音识别模型的识别准确率的目的。本申请提供一种远场语音识别方法、语音识别模型训练方法和服务器是这样实现的：一种远场语音识别方法，包括：获取语音数据；确定所述语音数据是否为远场语音数据；在确定所述语音数据为远场语音数据的情况下，通过语音识别模型对所述语音数据进行识别，其中，所述语音识别模型是根据通过语音数据的时间维度信息和频率维度信息，对所述语音数据的语音特征进行频带能量规整后得到的语音特征进行训练后得到的。一种语音识别模型训练方法，包括：获取滤波处理后的语音特征，其中，所述语音特征是从语音数...

【技术保护点】
1.一种远场语音识别方法，其特征在于，包括：/n获取滤波处理后的语音特征，其中，所述语音特征是从语音数据中提取得到的获取语音数据；/n确定所述语音数据是否为远场语音数据；/n在确定所述语音数据为远场语音数据的情况下，通过语音识别模型对所述语音数据进行识别，其中，所述语音识别模型是根据通过语音数据的时间维度信息和频率维度信息，对所述语音数据的语音特征进行频带能量规整后得到的语音特征进行训练后得到的。/n

【技术特征摘要】
1.一种远场语音识别方法，其特征在于，包括：
获取滤波处理后的语音特征，其中，所述语音特征是从语音数据中提取得到的获取语音数据；
确定所述语音数据是否为远场语音数据；
在确定所述语音数据为远场语音数据的情况下，通过语音识别模型对所述语音数据进行识别，其中，所述语音识别模型是根据通过语音数据的时间维度信息和频率维度信息，对所述语音数据的语音特征进行频带能量规整后得到的语音特征进行训练后得到的。

2.根据权利要求1所述的方法，其特征在于，还包括：
获取滤波处理后的语音特征，其中，所述语音特征是从语音数据中提取得到的；
通过所述语音数据的时间维度信息和频率维度信息，对所述语音特征进行频带能量规整；
根据频带能量规整后得到的语音特征，对语音识别模型进行训练，得到所述语音识别模型。

3.根据权利要求2所述的方法，其特征在于，通过所语音数据的时间维度信息和频率维度信息，对所述语音特征进行频带能量规整，包括：
确定时间影响参数；
通过所述时间影响参数，对前一时刻的中间平滑能量和当前时刻的时频块的能量进行加权，得到当前时刻的中间平滑能量；
根据所述当前时刻的中间平滑能量，对所述语音特征进行频带能量规整。

4.根据权利要求3所述的方法，其特征在于，确定时间影响参数，包括：
获取前一时刻的频带能量规整结果；
根据所述前一时刻的频带能量规整结果，计算得到时间影响参数。

5.根据权利要求4所述的方法，其特征在于，根据所述前一时刻的频带能量规整结果，确定时间影响参数，包括：
权重系数矩阵乘以前一时刻的频带能量规整结果，得到第一结果，其中，...

【专利技术属性】
技术研发人员：薛少飞，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人