语义槽填充模型训练方法及系统技术方案

技术编号：25047486 阅读：16 留言：0更新日期：2020-07-29 05:36

本发明专利技术实施例提供一种语义槽填充模型训练方法。该方法包括：对带有标注的第一训练数据集进行训练，生成第一语义槽填充模型；将自动语音识别的第二训练数据集，输入至第一语义槽填充模型，确定第一语义槽值对；基于规则的错误纠正模块对第一语义槽值对进行纠正，确定第二语义槽值对，其中，错误纠正模型基于预设规则对第一语义槽值对进行纠正；基于第二语义槽值对，对第一语义槽填充模型进行策略梯度训练，确定训练后的第二语义槽填充模型。本发明专利技术实施例还提供一种语义槽填充模型训练系统。本发明专利技术实施例通过强化学习将基于规则的错误纠正直接引入训练的方法，用于口语语义理解中的槽填充任务。从而提高语义理解对语音识别错误的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
语义槽填充模型训练方法及系统
本专利技术涉及智能语音领域，尤其涉及一种语义槽填充模型训练方法及系统。
技术介绍
口语语义理解是将自动语音识别产生的输出转化为结构化的语义表示的一种技术，因而对于语音识别错误非常敏感。在语义理解中，通常会使用语义槽填充。为了提升语义理解对语音识别错误的鲁棒性，会利用基于规则的纠正模型对语义槽填充预测的槽值进行纠正。进而保证口语语义理解的准确。在实现本专利技术过程中，专利技术人发现相关技术中至少存在如下问题：这些方法的缺陷在于槽填充模型和基于规则错误纠正模型是相互独立的，即使两个模型单独的训练，但纠正结果的好坏大幅度是受规则错误纠正模型限制的。然而错误纠正本应作为一个后处理模块，不应过于影响口语语义理解。使得口语语义理解对语音识别的鲁棒性较差。
技术实现思路
为了至少解决现有技术中口语语义理解中槽填充模型和基于规则错误纠正模型相互独立，使得口语理解对于语音识别错误的鲁棒性较差的问题。第一方面，本专利技术实施例提供一种语义槽填充模型训练方法，包括：对带有标注的第一训练数据集进行训练，生成第一语义槽填充模型；将自动语音识别的第二训练数据集，输入至所述第一语义槽填充模型，确定第一语义槽值对；基于规则的错误纠正模块对所述第一语义槽值对进行纠正，确定第二语义槽值对，其中，所述错误纠正模型基于预设规则对所述第一语义槽值对进行纠正；基于所述第二语义槽值对，对所述第一语义槽填充模型进行策略梯度训练，确定训练后的第二语义槽填充模型。...

【技术保护点】
1.一种语义槽填充模型训练方法，包括：/n对带有标注的第一训练数据集进行训练，生成第一语义槽填充模型；/n将自动语音识别的第二训练数据集，输入至所述第一语义槽填充模型，确定第一语义槽值对；/n基于规则的错误纠正模块对所述第一语义槽值对进行纠正，确定第二语义槽值对，其中，所述错误纠正模型基于预设规则对所述第一语义槽值对进行纠正；/n基于所述第二语义槽值对，对所述第一语义槽填充模型进行策略梯度训练，确定训练后的第二语义槽填充模型。/n

【技术特征摘要】
1.一种语义槽填充模型训练方法，包括：
对带有标注的第一训练数据集进行训练，生成第一语义槽填充模型；
将自动语音识别的第二训练数据集，输入至所述第一语义槽填充模型，确定第一语义槽值对；
基于规则的错误纠正模块对所述第一语义槽值对进行纠正，确定第二语义槽值对，其中，所述错误纠正模型基于预设规则对所述第一语义槽值对进行纠正；
基于所述第二语义槽值对，对所述第一语义槽填充模型进行策略梯度训练，确定训练后的第二语义槽填充模型。

2.根据权利要求1所述的方法，其中，在确定训练后的第二语义槽填充模型之后，所述方法还包括：
接收测试数据集；
将所述测试数据集输入至所述第二语义槽填充模型，确定纠正前的槽值对；
将所述纠正前的槽值对输入至所述错误纠正模块中，得到最终的槽值对。

3.根据权利要求1所述的方法，其中，所述对带有标注的第一训练数据集进行训练包括：
通过双向长短时记忆网络对带有标注的第一训练数据集进行训练。

4.根据权利要求1所述的方法，其中，所述语义槽值对包括语义三元组。

5.根据权利要求1所述的方法，其中，所述策略梯度训练包括：Pre-training预训练以及RL-training强化学习训练。

6.一种语义槽填充模...

【专利技术属性】
技术研发人员：俞凯，刘辰，朱苏，陈露，曹瑞升，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人