语音识别模型的训练方法及装置、存储介质、电子装置制造方法及图纸

技术编号：22755967 阅读：20 留言：0更新日期：2019-12-07 04:21

本发明专利技术提供了一种语音识别模型的训练方法及装置、存储介质、电子装置，其中，上述方法包括：获取以下至少之一数据：获取目标对象在有噪声的目标场景下的第一语音数据、不同目标场景的噪声数据、将所述噪声数据混合到无噪声的所述目标场景下的第二语音数据、将所述噪声数据混合到所述第一语音数据的第三语音数据；使用所述第一语音数据，所述噪声数据，所述第二语音数据和所述第三语音数据对语音识别模型进行训练，采用上述技术方案，解决了相关技术中在不同的背景噪声场景下，语音识别模型识别正常语音的准确率低等问题，提高了语音识别模型抗不同背景噪声的鲁棒性。

Training method, device, storage medium and electronic device of speech recognition model

The invention provides a training method and device, a storage medium and an electronic device for a speech recognition model, wherein the method comprises: acquiring at least one of the following data: acquiring the first speech data of a target object in a noisy target scene, the noise data of different target scenes, mixing the noise data to the second speech in a noiseless target scene Data, mixing the noise data with the third speech data of the first speech data; using the first speech data, the noise data, the second speech data and the third speech data to train the speech recognition model, adopting the above technical scheme, solving the problem that the speech recognition model recognizes the normal speech in different background noise scenarios in the related technology The problem of low accuracy of speech improves the robustness of speech recognition model against different background noise.

全部详细技术资料下载

【技术实现步骤摘要】
语音识别模型的训练方法及装置、存储介质、电子装置
本专利技术涉及通信领域，具体而言，涉及一种语音识别模型的训练方法及装置、存储介质、电子装置。
技术介绍
连锁餐厅为了提高服务员的服务规范，要求服务员按照餐厅指定的话术为顾客服务。通过佩戴录音设备，语音模型识别出服务员是否按照要求的话术进行服务，在当前主流的语音识别模型中，安静场景下能达到很高的识别准确性，但是真实环境的语音识别场景中，由于环境比较嘈杂，如连锁餐厅的环境，涉及到餐厅的不同背景噪声，如餐厅播放的背景音乐、服务员佩戴录音设备过程中产生的设备的摩擦噪声等，使得识别效果的准确率大大下降。针对相关技术中，在不同的背景噪声场景下，语音识别模型识别正常语音的准确率低等问题，尚未提出有效的技术方案。
技术实现思路
本专利技术实施例提供了一种语音识别模型的训练方法及装置、存储介质、电子装置，以至少解决相关技术中在不同的背景噪声场景下，语音识别模型识别正常语音的准确率低等问题。根据本专利技术的一个实施例，提供了一种语音识别模型的训练方法，包括：获取以下至少之一数据：获取目标对象在有噪声的目标场景下的第一语音数据、不同目标场景的噪声数据、将所述噪声数据混合到无噪声的所述目标场景下的第二语音数据、将所述噪声数据混合到所述第一语音数据的第三语音数据；使用所述第一语音数据，所述噪声数据，所述第二语音数据和所述第三语音数据对语音识别模型进行训练。在本专利技术实施例中，使用所述第一语音数据，所述噪声数据，所述第二语音数据和所述第三语音数据对语...

【技术保护点】
1.一种语音识别模型的训练方法，其特征在于，包括：/n获取以下至少之一数据：获取目标对象在有噪声的目标场景下的第一语音数据、不同目标场景的噪声数据、将所述噪声数据混合到无噪声的所述目标场景下的第二语音数据、将所述噪声数据混合到所述第一语音数据的第三语音数据；/n使用所述第一语音数据，所述噪声数据，所述第二语音数据和所述第三语音数据对语音识别模型进行训练。/n

【技术特征摘要】
1.一种语音识别模型的训练方法，其特征在于，包括：
获取以下至少之一数据：获取目标对象在有噪声的目标场景下的第一语音数据、不同目标场景的噪声数据、将所述噪声数据混合到无噪声的所述目标场景下的第二语音数据、将所述噪声数据混合到所述第一语音数据的第三语音数据；
使用所述第一语音数据，所述噪声数据，所述第二语音数据和所述第三语音数据对语音识别模型进行训练。

2.根据权利要求1所述的方法，其特征在于，使用所述第一语音数据，所述噪声数据，所述第二语音数据和所述第三语音数据对语音识别模型进行训练之后，所述方法还包括：
使用训练后的语音识别模型对有噪声的所述目标场景下的目标对象的语音进行识别，得到语音识别结果。

3.根据权利要求1所述的方法，其特征在于，使用所述第一语音数据，所述噪声数据，所述第二语音数据和所述第三语音数据对语音识别模型进行训练，包括：
对至少由所述第一语音数据，所述噪声数据，所述第二语音数据和所述第三语音数据组成的集合按照预定比例划分为三个子集，其中，所述子集包括：训练集，测试集，验证集；
使用所述训练集对所述语音识别模型进行训练。

4.根据权利要求3所述的方法，其特征在于，所述预定比例包括：7:2:1，8:1:1。

5.一种语音识别模型的训练装置，其特征在于，包括：
获取模块，用于获取以下至...

【专利技术属性】
技术研发人员：刘洋，唐大闰，
申请(专利权)人：秒针信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人