基于深度学习的电话机器人语音识别结果校正方法技术

技术编号:21303913 阅读:44 留言:0更新日期:2019-06-12 09:08
本发明专利技术公开了一种基于深度学习的电话机器人语音识别结果校正方法,基于历史语音数据集得到拼音语句文本数据集Sp和正确的语句文本样本集Sc,采用深度学习建立校正模型,建立校正模型包括基于一个多头注意力模型和前馈神经网络的encoder部分构建和基于堆叠的两个多头注意力模型和前馈神经网络的decoder部分构建,基于正确的语句文本样本集Sc对建立的校正模型进行训练,将需要校正的语音识别结果经向量化过程处理后输入训练好的校正模型,得到校正后的文本。本发明专利技术充分利用历史录音数据资源,训练语音识别结果校正模型,对不安静环境和多种不同说话方式、发音准确度、收音能力等语音识别精度低情况的高效语音识别校正。

Correction Method of Speech Recognition Result of Telephone Robot Based on Deep Learning

The invention discloses a method of speech recognition result correction for telephone robot based on deep learning. The Sp and Sc of Pinyin sentence text data set and correct sentence text sample set are obtained based on historical speech data set. The correction model is established by deep learning. The correction model includes the construction of encoder part based on a multi-head attention model and feedforward neural network and stacking. Two multi-head attention models and decoder part of feedforward neural network are constructed. The corrected model is trained based on the correct sentence text sample set Sc. The corrected speech recognition results are input into the trained corrected model after the vectorization process, and the corrected text is obtained. The invention makes full use of historical recording data resources, trains speech recognition result correction model, and effectively corrects speech recognition accuracy of low speech recognition accuracy in quiet environment and various different speech modes, pronunciation accuracy, radio ability, etc.

【技术实现步骤摘要】
基于深度学习的电话机器人语音识别结果校正方法
本专利技术属于语音识别
,具体涉及基于深度学习的电话机器人语音识别结果校正方法。
技术介绍
随着以客户为主导的市场的形成,以及电话的普及,越来越多的企业开始采用外呼系统来扩大和维护客户,增加企业效益。通过外呼系统与客户建立良好的沟通桥梁,了解客户情况、意见及需求,主动向客户宣传公司新政策、新优惠、推荐新业务,及时对新入网客户就服务态度、产品质量、使用情况等进行回访,在外拨回访的过程中达到保留客户及扩大客户数量的目的。传统的外呼系统一般采用信息系统进行呼叫处理、控制、分配坐席终端,最终由人工坐席完成呼叫。这种方法有利于处理复杂多变的用户需求,可以获得较高的外呼效果。但是由于人力成本逐年增高,外呼成本也逐渐增高,并且随着外呼业务的扩展,合格的坐席人员也越来越紧缺。智能电话机器人是解决上述问题的一个较好选项,电话机器人一般包括语音识别、意图识别、对话管理等模块,其中语音识别能力是电话机器人的基础,只有正确识别出客户所说的话语,才能进一步做意图识别、对话,从而驱动电话机器人与客户进行交流。现阶段的语音识别技术,在近场、安静环境下针对比较清晰本文档来自技高网...

【技术保护点】
1.一种基于深度学习的电话机器人语音识别结果校正方法,其特征在于:方法步骤如下:步骤1、将对历史语音数据集语音识别得到的语句文本数据集S转换得到拼音语句文本数据集Sp,并对语句文本数据集S进行校正,得到正确的语句文本样本集Sc;步骤2、采用深度学习建立校正模型,建立校正模型的步骤如下:步骤2.1、校正模型的encoder部分构建:建立拼音词典,利用拼音词典将步骤1中所得拼音语句文本数据集Sp进行编码,得到输入样本So,对So进行词嵌入训练和位置编码,将所得位置编码与嵌入矩阵相加,得到输入样本集Si,将输入样本集si作为输入多头注意力模型,将多头注意力模型的输出送入前馈神经网络,最终输出特征矩阵...

【技术特征摘要】
1.一种基于深度学习的电话机器人语音识别结果校正方法,其特征在于:方法步骤如下:步骤1、将对历史语音数据集语音识别得到的语句文本数据集S转换得到拼音语句文本数据集Sp,并对语句文本数据集S进行校正,得到正确的语句文本样本集Sc;步骤2、采用深度学习建立校正模型,建立校正模型的步骤如下:步骤2.1、校正模型的encoder部分构建:建立拼音词典,利用拼音词典将步骤1中所得拼音语句文本数据集Sp进行编码,得到输入样本So,对So进行词嵌入训练和位置编码,将所得位置编码与嵌入矩阵相加,得到输入样本集Si,将输入样本集si作为输入多头注意力模型,将多头注意力模型的输出送入前馈神经网络,最终输出特征矩阵Sf,完成校正模型的encoder部分构建;步骤2.2、校正模型的decoder部分构建:建立汉字词典,基于汉字词典采用与步骤2.1中由拼音语句文本数据集Sp得到输入样本集Si相同的处理方法来处理语句文本样本集Sc得到加有位置编码的标签的嵌入矩阵,使用两个堆叠的多头注意力模型,将加有位置编码的标签的嵌入矩阵作为第一个多头注意力模型的输入,将第一个多头注意力模型的输出和步骤2.1得到的输出Sf共同作为第二个多头注意力模型的输入,将堆叠后的多头注意力模型的输出送入前馈神经网络,将前馈神经网络的输出作为softmax函数的输入,输出一个概率,取概率最大者为预测结果,查找词典得到校正后的文本,完成校正模型的decoder部分构建;步骤3、将...

【专利技术属性】
技术研发人员:王泽飞
申请(专利权)人:成都富王科技有限公司
类型:发明
国别省市:四川,51

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1