【技术实现步骤摘要】
模型的训练方法、语音识别方法和装置、设备及存储介质
[0001]本申请涉及金融科技领域,尤其涉及一种模型的训练方法、语音识别方法和装置、设备及存储介质。
技术介绍
[0002]随着网络、通讯、计算机技术的发展,企业呈现出电子化、远程化、虚拟化、网络化的特点,更多的线上企业大量涌现。而客户与企业之间的通信与对话,也由面对面的咨询、交涉发展到基于网络、电话等远程手段的交流和沟通。在此背景下,智能语音交互在被广泛应用于金融、物流、客服等领域。
[0003]目前,基于语音交互的金融交易平台每天都面对着大量的电话语音服务,处理客户多样化的服务需求,包括售前咨询、购买、售后、投诉等。在电话服务的过程中,智能客服机器人需要应对不同的服务对象,并作出合适的反应。如果智能客服在对话交流中无法准确地识别到服务对象在语音数据中所表征的诉求,会导致基于语音数据反馈的服务应答不符合对象需求等问题,影响服务质量和对象满意度。
[0004]语音识别任务主要是将语音音频转换为文字形式。目前的语音识别方法大多数需要依赖于神经网络模型进行识别, ...
【技术保护点】
【技术特征摘要】
1.一种模型的训练方法,其特征在于,所述训练方法包括:获取样本语音数据和所述样本语音数据对应的样本文本数据;将所述样本语音数据和所述样本文本数据输入至预设的神经网络模型中,其中,所述神经网络模型包括编码网络和解码网络;通过所述编码网络的卷积层对所述样本语音数据进行特征提取,得到样本语音特征向量;通过所述编码网络的稀疏注意力层对所述样本语音特征向量进行注意力计算,得到样本语音表征向量;通过所述解码网络对所述样本文本数据进行编码处理,得到样本文本编码向量;通过所述解码网络的注意力层对所述样本文本编码向量和所述样本语音表征向量进行重构处理,得到样本关系特征向量,所述样本关系特征向量用于表征所述样本文本编码向量和所述样本语音表征向量之间的相关程度;通过预设的损失函数和所述样本关系特征向量对所述神经网络模型进行参数更新,以训练所述神经网络模型,得到语音识别模型。2.根据权利要求1所述的训练方法,其特征在于,所述通过所述编码网络的卷积层对所述样本语音数据进行特征提取,得到样本语音特征向量,包括:通过所述卷积层对所述样本语音数据进行卷积处理,得到样本语音卷积向量;通过所述卷积层对所述样本语音卷积向量进行下采样处理,得到样本语音采样特征;对所述样本语音采样特征进行位置编码,得到所述样本语音特征向量。3.根据权利要求1所述的训练方法,其特征在于,所述通过所述编码网络的稀疏注意力层对所述样本语音特征向量进行注意力计算,得到样本语音表征向量,包括:通过所述稀疏注意力层的预设函数对所述样本语音特征向量进行归一化处理,得到样本概率特征;根据所述样本概率特征和预设的概率阈值对所述样本语音特征向量进行筛选处理,得到候选语音特征向量,其中,所述候选语音特征向量为样本概率特征大于所述概率阈值的样本语音特征向量;根据预设的权重参数对所述候选语音特征向量进行注意力计算,得到所述样本语音表征向量。4.根据权利要求1所述的训练方法,其特征在于,所述通过所述解码网络的注意力层对所述样本文本编码向量和所述样本语音表征向量进行重构处理,得到样本关系特征向量,包括:通过所述注意力层对所述样本文本编码向量进行自注意力计算,得到样本文本表征向量;通过所述注意力层对所述样本语音表征向量和所述样本文本表征向量进行注意力计算,得到初始关系特征向量;根据预设的向量特征维度,将所述初始关系特征向量映射到预设的向量空间,得到所述样本关系特征向量。5.根据权利要求1至4任一项所述的训练方法,其特征在于,所述通过预设的损失函数...
【专利技术属性】
技术研发人员:刘杰,王健宗,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。