意图识别模型训练方法、意图识别方法以及相关装置制造方法及图纸

技术编号：24173652 阅读：28 留言：0更新日期：2020-05-16 03:49

本发明专利技术提供一种意图识别模型训练方法、意图识别方法以及相关装置，该方意图识别模型训练方法包括：利用带标签的训练样本数据对卷积神经网络进行初步训练；采用条件变分自编码器对所述带标签的训练样本数据进行数据增强得到带标签的扩充样本数据；利用所述带标签的扩充样本数据对经过初步训练的卷积神经网络进行再训练，得到意图识别模型。其中，通过采用条件变分自编码器对所述带标签的训练样本数据进行数据增强得到带标签的扩充样本数据，然后利用所述带标签的扩充样本数据对经过初步训练的卷积神经网络进行再训练，能够在利用少量精确标注的训练语料的基础上，提高模型精度，降低人工成本。

Intention recognition model training method, intention recognition method and related devices

全部详细技术资料下载

【技术实现步骤摘要】
意图识别模型训练方法、意图识别方法以及相关装置
本专利技术涉及人工智能
，尤其涉及一种意图识别模型训练方法、意图识别方法以及相关装置。
技术介绍
近年来，数据资源呈现爆炸式增长，其中蕴含着用户通过自然语言表达出的各种各样的需求，这些需求在一定范围内具有“主观性”，例如，用户通过Google、百度等搜索引擎查询信息的需求，在查询日志中记录了人们从互联网搜索需要了解的查询信息，可以称之为查询意图；用户在一定购买动机的支配下，通过文本内容表达出的对产品或服务的购买意愿，可以称之为消费意图；消费者愿意将自己日常生活费的部分资金用来购买投资理财产品，通过与客户经理的交互所展现的对银行理财产品的兴趣或需求，可以称之为财富管理意图等。我们以财富管理意图为例，从理财经理和客户的交互数据当中发现，当客户经理询问“有一款理财产品想给您推荐”时，用户在沟通中倾向于表达其对理财产品是否有需求，具体如表1所示：表1理财场景中的用户意图示例对话人示例意图类别客户1这是个什么类型的产品？显式意图客户2哦，我现在可以考虑考虑的显式意图客户3我不需要显式无意图客户4哦，我现在不考虑显式无意图客户5我现在有点忙，等会联系隐式无意图客户6谢谢，我有需要的话自己会去查看的隐式无意图<...

【技术保护点】
1.一种意图识别模型训练方法，其特征在于，包括：/n利用带标签的训练样本数据对卷积神经网络进行初步训练；/n采用条件变分自编码器对所述带标签的训练样本数据进行数据增强得到带标签的扩充样本数据；/n利用所述带标签的扩充样本数据对经过初步训练的卷积神经网络进行再训练，得到意图识别模型。/n

【技术特征摘要】
1.一种意图识别模型训练方法，其特征在于，包括：
利用带标签的训练样本数据对卷积神经网络进行初步训练；
采用条件变分自编码器对所述带标签的训练样本数据进行数据增强得到带标签的扩充样本数据；
利用所述带标签的扩充样本数据对经过初步训练的卷积神经网络进行再训练，得到意图识别模型。

2.根据权利要求1所述的意图识别模型训练方法，所述条件变分自编码器包括：用于将语句向量压缩为隐变量的编码器以及用于将隐变量解压缩重构为扩充语句向量的解码器；
所述采用条件变分自编码器对所述带标签的训练样本数据进行数据增强得到带标签的扩充样本数据包括：
将一训练样本转换为语句向量；
将所述语句向量以及预设约束条件输入所述编码器得到所述隐变量；
将所述隐变量以及所述预设约束条件输入所述解码器得到所述扩充句子向量；
将所述扩充句子向量转换为一扩充样本；
其中，所述扩充样本的标签与所述训练样本的标签相同。

3.根据权利要求2所述的意图识别模型训练方法，所述编码器采用RNN实现。

4.根据权利要求2所述的意图识别模型训练方法，所述解码器采用神经网络实现。

5.根据权利要求1所述的意图识别模型训练方法，其特征在于，还包括：
获取条件变分自编码器训练数据；
利用所述条件变分自编码器训练数据对所述条件变分自编码器进行训练。

6.一种意图识别...

【专利技术属性】
技术研发人员：付博，顾远，袁晟君，李宸，王雪，张晨，谢隆飞，李亚雄，
申请(专利权)人：中国建设银行股份有限公司，建信金融科技有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人