模型训练、意图识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30892931 阅读:10 留言:0更新日期:2021-11-22 23:34
本公开实施例提供了一种模型训练、意图识别方法、装置、电子设备及存储介质。模型训练方法包括:获取样本数据和预设的初始模型;在利用所述样本数据对预设初始模型进行训练的过程中,识别各所述样本数据的复杂程度,并调整不同复杂程度的样本数据的比例;响应于确定训练完成,得到训练完成的模型。本公开实施例中通过在模型训练过程中不断调整不同复杂程度的样本的比例,对不同复杂程度的样本赋予不同的关注程度,从而能够更有效地学习不同复杂程度的样本,提升模型的性能。提升模型的性能。提升模型的性能。

【技术实现步骤摘要】
模型训练、意图识别方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,特别是涉及一种模型训练、意图识别方法、装置、电子设备及存储介质。

技术介绍

[0002]意图识别是通过分类的办法将用户输入的文本划分到相应的意图类别。意图识别是理解用户查询的关键部分,通常通过语义分类来预测意图类别,在搜索、任务型对话等领域有着广泛的应用场景。
[0003]意图识别模型是进行意图识别的一种常用工具。参照图1,示出了现有技术的一种意图识别模型的处理过程示意图。如图1所示,现有技术中,基于标准意图数据和用户表述得到带有意图标签的数据,对收集的数据进行随机等概率采样,训练得到意图识别模型,利用训练完成的意图识别模型对用户新表述进行预测,得到预测的意图。
[0004]但是,现有技术中在模型训练过程中,对每个样本赋予相同的关注程度,容易导致某些样本被过度学习,而某些样本无法充分学习,从而影响模型的性能。

技术实现思路

[0005]鉴于上述问题,本公开实施例提出一种模型训练、意图识别方法、装置、电子设备及存储介质,用以提升模型的性能。
[0006]根据本公开的实施例的第一方面,提供了一种模型训练方法,包括:
[0007]获取样本数据和预设的初始模型;
[0008]在利用所述样本数据对所述初始模型进行训练的过程中,识别各所述样本数据的复杂程度,并调整不同复杂程度的样本数据的比例;
[0009]响应于确定训练完成,得到训练完成的模型。
[0010]可选地,识别各所述样本数据的复杂程度,包括:提取各所述样本数据的特征向量;基于所述特征向量计算各所述样本数据的复杂程度。
[0011]可选地,提取各所述样本数据的特征向量,包括:针对每个样本数据,获取当前样本数据中包含的各分词的语义表示向量;将所述语义表示向量的平均值作为当前样本数据的特征向量。
[0012]可选地,基于所述特征向量计算各所述样本数据的复杂程度,包括:将属于同一类别的样本数据划分为一个样本集合;针对每个样本集合,基于当前样本集合中包含的各样本数据的特征向量,计算当前样本集合中包含的各样本数据的累积密度;基于当前样本集合中包含的各样本数据的累积密度,计算当前样本集合中包含的各样本数据的复杂程度。
[0013]可选地,基于当前样本集合中包含的各样本数据的特征向量,计算当前样本集合中包含的各样本数据的累积密度,包括:针对当前样本集合中的每两个样本数据,基于当前两个样本数据的特征向量计算当前两个样本数据之间的距离;基于所述距离确定参考距离;针对当前样本集合中包含的每个样本数据,基于当前样本数据与当前样本集合中包含
的其他各样本数据之间的距离以及所述参考距离,计算当前样本数据的累积密度。
[0014]可选地,基于当前样本数据与当前样本集合中包含的其他各样本数据之间的距离以及所述参考距离,计算当前样本数据的累积密度,包括:如果当前样本数据与某个其他样本数据之间的距离小于所述参考距离,则确定当前样本数据与该其他样本数据之间的累积值为1;如果当前样本数据与某个其他样本数据之间的距离大于等于所述参考距离,则确定当前样本数据与该其他样本数据之间的累积值为0;将当前样本数据与当前样本集合中包含的其他各样本数据之间的累积值的总和,作为当前样本数据的累积密度。
[0015]可选地,基于所述距离确定参考距离,包括:对所述距离进行升序排序;选取排序后位于预设位置的距离作为所述参考距离。
[0016]可选地,基于当前样本集合中包含的各样本数据的累积密度,计算当前样本集合中包含的各样本数据的复杂程度,包括:按照预设的复杂程度种类数,基于所述累积密度将当前样本集合划分为所述复杂程度种类数的聚类簇;按照累积密度与复杂程度负相关的关系,基于所述聚类簇中包含的样本数据的累积密度,确定所述聚类簇中包含的样本数据的复杂程度。
[0017]可选地,调整不同复杂程度的样本数据的比例,包括:针对每种复杂程度,获取当前复杂程度对应的样本数据的第一数量,以及当前复杂程度对应的调度函数;所述调度函数与基于当前训练轮数确定的权重值相关;将所述调度函数与所述第一数量的乘积,作为当前复杂程度对应的样本数据的目标数量。
[0018]可选地,在调整不同复杂程度的样本数据的比例之前,还包括:获取本轮训练中复杂程度最高的样本数据的第二数量,以及前一轮训练中复杂程度最高的样本数据的第三数量,并比较所述第二数量和所述第三数量;调整不同复杂程度的样本数据的比例,包括:如果所述第二数量小于所述第三数量,则调整不同复杂程度的样本数据的比例。
[0019]根据本公开的实施例的第二方面,提供了一种意图识别方法,包括:
[0020]获取待处理数据和预先训练的意图识别模型;所述意图识别模型通过如上任一项所述的模型训练方法训练得到;
[0021]将所述待处理数据输入所述意图识别模型,得到所述意图识别模型的输出结果,所述输出结果为所述待处理数据对应的意图信息。
[0022]根据本公开的实施例的第三方面,提供了一种模型训练装置,包括:
[0023]第一获取模块,用于获取样本数据和预设的初始模型;
[0024]训练模块,用于在利用所述样本数据对所述初始模型进行训练的过程中,识别各所述样本数据的复杂程度,并调整不同复杂程度的样本数据的比例;
[0025]确定模块,用于响应于确定训练完成,得到训练完成的模型。
[0026]可选地,所述训练模块包括:提取子模块,用于提取各所述样本数据的特征向量;第一计算子模块,用于基于所述特征向量计算各所述样本数据的复杂程度。
[0027]可选地,所述提取子模块包括:向量获取单元,用于针对每个样本数据,获取当前样本数据中包含的各分词的语义表示向量;向量计算单元,用于将所述语义表示向量的平均值作为当前样本数据的特征向量。
[0028]可选地,所述第一计算子模块包括:集合划分单元,用于将属于同一类别的样本数据划分为一个样本集合;密度计算单元,用于针对每个样本集合,基于当前样本集合中包含
的各样本数据的特征向量,计算当前样本集合中包含的各样本数据的累积密度;程度计算单元,用于基于当前样本集合中包含的各样本数据的累积密度,计算当前样本集合中包含的各样本数据的复杂程度。
[0029]可选地,所述密度计算单元包括:距离计算子单元,用于针对当前样本集合中的每两个样本数据,基于当前两个样本数据的特征向量计算当前两个样本数据之间的距离;参考确定子单元,用于基于所述距离确定参考距离;累积计算子单元,用于针对当前样本集合中包含的每个样本数据,基于当前样本数据与当前样本集合中包含的其他各样本数据之间的距离以及所述参考距离,计算当前样本数据的累积密度。
[0030]可选地,所述累积计算子单元,具体用于如果当前样本数据与某个其他样本数据之间的距离小于所述参考距离,则确定当前样本数据与该其他样本数据之间的累积值为1;如果当前样本数据与某个其他样本数据之间的距本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取样本数据和预设的初始模型;在利用所述样本数据对所述初始模型进行训练的过程中,识别各所述样本数据的复杂程度,并调整不同复杂程度的样本数据的比例;响应于确定训练完成,得到训练完成的模型。2.根据权利要求1所述的方法,其特征在于,识别各所述样本数据的复杂程度,包括:提取各所述样本数据的特征向量;基于所述特征向量计算各所述样本数据的复杂程度。3.根据权利要求2所述的方法,其特征在于,提取各所述样本数据的特征向量,包括:针对每个样本数据,获取当前样本数据中包含的各分词的语义表示向量;将所述语义表示向量的平均值作为当前样本数据的特征向量。4.根据权利要求2所述的方法,其特征在于,基于所述特征向量计算各所述样本数据的复杂程度,包括:将属于同一类别的样本数据划分为一个样本集合;针对每个样本集合,基于当前样本集合中包含的各样本数据的特征向量,计算当前样本集合中包含的各样本数据的累积密度;基于当前样本集合中包含的各样本数据的累积密度,计算当前样本集合中包含的各样本数据的复杂程度。5.根据权利要求4所述的方法,其特征在于,基于当前样本集合中包含的各样本数据的特征向量,计算当前样本集合中包含的各样本数据的累积密度,包括:针对当前样本集合中的每两个样本数据,基于当前两个样本数据的特征向量计算当前两个样本数据之间的距离;基于所述距离确定参考距离;针对当前样本集合中包含的每个样本数据,基于当前样本数据与当前样本集合中包含的其他各样本数据之间的距离以及所述参考距离,计算当前样本数据的累积密度。6.根据权利要求5所述的方法,其特征在于,基于当前样本数据与当前样本集合中包含的其他各样本数据之间的距离以及所述参考距离,计算当前样本数据的累积密度,包括:如果当前样本数据与某个其他样本数据之间的距离小于所述参考距离,则确定当前样本数据与该其他样本数据之间的累积值为1;如果当前样本数据与某个其他样本数据之间的距离大于等于所述参考距离,则确定当前样本数据与该其他样本数据之间的累积值为0;将当前样本数据与当前样本集合中包含的其他各样本数据之间的累积值的总和,作为当前样本数据的累积密度。7.根据权利要求5所述的方法,其特征在于,基于所述距离确定参考距离,包括:对所述距离进行升序排序;选取排序后位于预设位置的距离作为所述参考距离。8.根据权利要求4所述的方法,其特征在于,基于当前样本集合中包含的各样本数据的累积密度,计算当前样本集合中包含的各样本数据的复杂程度,包括:按照预设的复杂程度种类数,基于所述累积密度将当前样本集合划分为...

【专利技术属性】
技术研发人员:刘操龚彦韬袁家振杨帆蔡勋梁万广鲁牛瑞瑶
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1