模型训练、意图识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：30892931 阅读：10 留言：0更新日期：2021-11-22 23:34

本公开实施例提供了一种模型训练、意图识别方法、装置、电子设备及存储介质。模型训练方法包括：获取样本数据和预设的初始模型；在利用所述样本数据对预设初始模型进行训练的过程中，识别各所述样本数据的复杂程度，并调整不同复杂程度的样本数据的比例；响应于确定训练完成，得到训练完成的模型。本公开实施例中通过在模型训练过程中不断调整不同复杂程度的样本的比例，对不同复杂程度的样本赋予不同的关注程度，从而能够更有效地学习不同复杂程度的样本，提升模型的性能。提升模型的性能。提升模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练、意图识别方法、装置、电子设备及存储介质

[0001]本公开涉及计算机
，特别是涉及一种模型训练、意图识别方法、装置、电子设备及存储介质。

技术介绍

[0002]意图识别是通过分类的办法将用户输入的文本划分到相应的意图类别。意图识别是理解用户查询的关键部分，通常通过语义分类来预测意图类别，在搜索、任务型对话等领域有着广泛的应用场景。
[0003]意图识别模型是进行意图识别的一种常用工具。参照图1，示出了现有技术的一种意图识别模型的处理过程示意图。如图1所示，现有技术中，基于标准意图数据和用户表述得到带有意图标签的数据，对收集的数据进行随机等概率采样，训练得到意图识别模型，利用训练完成的意图识别模型对用户新表述进行预测，得到预测的意图。
[0004]但是，现有技术中在模型训练过程中，对每个样本赋予相同的关注程度，容易导致某些样本被过度学习，而某些样本无法充分学习，从而影响模型的性能。

技术实现思路

[0005]鉴于上述问题，本公开实施例提出一种模型训练、意图识别方法、装置、电子设备及存储介质，用以提升模型的性能。
[0006]根据本公开的实施例的第一方面，提供了一种模型训练方法，包括：
[0007]获取样本数据和预设的初始模型；
[0008]在利用所述样本数据对所述初始模型进行训练的过程中，识别各所述样本数据的复杂程度，并调整不同复杂程度的样本数据的比例；
[0009]响应于确定训练完成，得到训练完成的模型。
[0010]可选地，识别...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取样本数据和预设的初始模型；在利用所述样本数据对所述初始模型进行训练的过程中，识别各所述样本数据的复杂程度，并调整不同复杂程度的样本数据的比例；响应于确定训练完成，得到训练完成的模型。2.根据权利要求1所述的方法，其特征在于，识别各所述样本数据的复杂程度，包括：提取各所述样本数据的特征向量；基于所述特征向量计算各所述样本数据的复杂程度。3.根据权利要求2所述的方法，其特征在于，提取各所述样本数据的特征向量，包括：针对每个样本数据，获取当前样本数据中包含的各分词的语义表示向量；将所述语义表示向量的平均值作为当前样本数据的特征向量。4.根据权利要求2所述的方法，其特征在于，基于所述特征向量计算各所述样本数据的复杂程度，包括：将属于同一类别的样本数据划分为一个样本集合；针对每个样本集合，基于当前样本集合中包含的各样本数据的特征向量，计算当前样本集合中包含的各样本数据的累积密度；基于当前样本集合中包含的各样本数据的累积密度，计算当前样本集合中包含的各样本数据的复杂程度。5.根据权利要求4所述的方法，其特征在于，基于当前样本集合中包含的各样本数据的特征向量，计算当前样本集合中包含的各样本数据的累积密度，包括：针对当前样本集合中的每两个样本数据，基于当前两个样本数据的特征向量计算当前两个样本数据之间的距离；基于所述距离确定参考距离；针对当前样本集合中包含的每个样本数据，基于当前样本数据与当前样本集合中包含的其他各样本数据之间的距离以及所述参考距离，计算当前样本数据的累积密度。6.根据权利要求5所述的方法，其特征在于，基于当前样本数据与当前样本集合中包含的其他各样本数据之间的距离以及所述参考距离，计算当前样本数据的累积密度，包括：如果当前样本数据与某个其他样本数据之间的距离小于所述参考距离，则确定当前样本数据与该其他样本数据之间的累积值为1；如果当前样本数据与某个其他样本数据之间的距离大于等于所述参考距离，则确定当前样本数据与该其他样本数据之间的累积值为0；将当前样本数据与当前样本集合中包含的其他各样本数据之间的累积值的总和，作为当前样本数据的累积密度。7.根据权利要求5所述的方法，其特征在于，基于所述距离确定参考距离，包括：对所述距离进行升序排序；选取排序后位于预设位置的距离作为所述参考距离。8.根据权利要求4所述的方法，其特征在于，基于当前样本集合中包含的各样本数据的累积密度，计算当前样本集合中包含的各样本数据的复杂程度，包括：按照预设的复杂程度种类数，基于所述累积密度将当前样本集合划分为...

【专利技术属性】
技术研发人员：刘操，龚彦韬，袁家振，杨帆，蔡勋梁，万广鲁，牛瑞瑶，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人