意图识别模型的训练方法、系统、装置及可读存储介质制造方法及图纸

技术编号：18084668 阅读：300 留言：0更新日期：2018-05-31 12:59

本发明专利技术公开了一种意图识别模型的训练方法、系统、装置及可读存储介质，包括预先根据源任务模型和源任务标注语料训练基础模型；将基础模型的网络层的参数导入到目标任务模型的公共网络层中，并固定公共网络层的参数；通过目标任务标注语料微调目标任务模型的特有网络层的参数，其中，特有网络层为目标任务模型中除公共网络层外的网络层，源任务标注语料的数量大于目标任务标注语料的数量。本发明专利技术通过对源任务语料及源任务模型迁移学习来训练目标任务模型，只需要标注少量的目标任务语料对目标任务模型进行微调就可以使目标任务模型获得较高的准确率，节约了目标任务模型的训练成本，同时还能有效的减少目标任务模型的训练时间。

全部详细技术资料下载

【技术实现步骤摘要】
意图识别模型的训练方法、系统、装置及可读存储介质
本专利技术涉及人工智能领域，特别是涉及一种意图识别模型的训练方法、系统、装置及可读存储介质。
技术介绍
随着网络技术的发展，AI(ArtificialIntelligence，人工智能)技术得到了广泛应用，比如聊天机器人chatbot已经应用于智能客服、私人助理、情感陪伴等众多领域。对于chatbot来说最重要的技术即为意图识别技术，只有准确的理解用户的意图，才能更好的为用户服务。意图识别技术一般基于深度学习的CNN(ConvolutionalNeuralNetworks，卷积神经网络)或RNN(RecurrentNeuralNetwork，循环神经网络)分类算法，但是通过深度学习的CNN或RNN分类算法来训练意图识别模型需要大量的、且成本较高的人工标注语料，如果为了节约成本，使用少量的人工标注语料来训练意图识别模型，则会导致意图识别模型欠拟合，从而降低预测的准确率。因此，如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
技术实现思路
本专利技术的目的是提供一种意图识别模型的训练方法、系统、装置及可读存储介质，节约了目标任务模型的训练成本，同时还能有效的减少目标任务模型的训练时间。为解决上述技术问题，本专利技术提供了一种意图识别模型的训练方法，包括：预先根据源任务模型和源任务标注语料训练基础模型；将所述基础模型的网络层的参数导入到目标任务模型的公共网络层中，并固定所述公共网络层的参数；通过目标任务标注语料微调所述目标任务模型的特有网络层的参数，其中，所述特有网络层为所述目标任务模型中除所述...
意图识别模型的训练方法、系统、装置及可读存储介质

【技术保护点】
一种意图识别模型的训练方法，其特征在于，包括：预先根据源任务模型和源任务标注语料训练基础模型；将所述基础模型的网络层的参数导入到目标任务模型的公共网络层中，并固定所述公共网络层的参数；通过目标任务标注语料微调所述目标任务模型的特有网络层的参数，其中，所述特有网络层为所述目标任务模型中除所述公共网络层外的网络层，所述源任务标注语料的数量大于所述目标任务标注语料的数量。

【技术特征摘要】
1.一种意图识别模型的训练方法，其特征在于，包括：预先根据源任务模型和源任务标注语料训练基础模型；将所述基础模型的网络层的参数导入到目标任务模型的公共网络层中，并固定所述公共网络层的参数；通过目标任务标注语料微调所述目标任务模型的特有网络层的参数，其中，所述特有网络层为所述目标任务模型中除所述公共网络层外的网络层，所述源任务标注语料的数量大于所述目标任务标注语料的数量。2.根据权利要求1所述的训练方法，其特征在于，所述公共网络层的参数包括所述公共网络层的权重；则所述固定所述公共网络层的参数的过程具体为：固定所述公共网络层的权重。3.根据权利要求2所述的训练方法，其特征在于，所述特有网络层的参数包括所述特有网络层的权重；则所述通过目标任务标注语料微调所述目标任务模型的特有网络层的参数的过程具体为：通过目标任务标注语料微调所述目标任务模型的特有网络层的权重。4.根据权利要求1-3任意一项所述的训练方法，其特征在于，所述源任务模型为单句意图识别模型；相应的，所述目标任务模型为上下文意图识别模型。5.一种意图识别模型的训练系统，其特征在于，包括：训练模块，用于预先根据源任务模型和源任务标注语料训练基础模型；固定模块，用于将所述基础模型的网络层...

【专利技术属性】
技术研发人员：韩卫强，权圣，
申请(专利权)人：北京中关村科金技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人