一种意图匹配度分析模型的训练方法及装置制造方法及图纸

技术编号:35867333 阅读:14 留言:0更新日期:2022-12-07 11:00
本申请公开了一种意图匹配度分析模型的训练方法及装置,方法包括:获取样本数据集,所述样本数据集中包括多个样本数据,一条样本数据包括一个文本和一个意图,所述样本数据具有对应的样本意图置信度;将样本数据输入初始模型得到样本数据对应的待定意图置信度;利用所述待定意图置信度与所述样本意图置信度的差异调整所述初始模型得到意图匹配度分析模型,所述意图匹配度分析模型用于分析文本与意图的匹配度。使用本申请公开的方法训练出的意图匹配度分析模型可以分析出文本与意图的匹配度,即使是新的意图也可以通过分析匹配度进行识别,对零意图样本的意图进行分析识别,提高了意图识别的外延性。了意图识别的外延性。了意图识别的外延性。

【技术实现步骤摘要】
一种意图匹配度分析模型的训练方法及装置


[0001]本申请涉及自然语言理解
,特别是涉及一种意图匹配度分析模型的训练方法及装置。

技术介绍

[0002]随着科技的不断发展,人们对意图识别的应用也越来越多。意图识别,顾名思义就是判断一句话或者一个文本是什么意思或者要做些什么,比如要对一个问题进行意图识别,就要判断这个问题想要得到的是天气、是新闻还是想要得到其他类型的信息。现有技术中对意图识别采用预定义好的意图类别训练分类模型,但是通过这种方式训练出的模型对新出现的,没有进行分类的意图不能进行识别,外延性较差。

技术实现思路

[0003]基于上述问题,本申请提供了一种意图匹配度分析模型的训练方法及装置。
[0004]本申请公开了一种意图匹配度分析模型的训练方法:
[0005]获取样本数据集,所述样本数据集中包括多个样本数据,一条样本数据包括一个文本和一个意图,所述样本数据具有对应的样本意图置信度,所述样本意图置信度用于表示样本数据中文本与意图的匹配程度;
[0006]将样本数据输入初始模型得到样本数据对应的待定意图置信度;
[0007]利用所述待定意图置信度与所述样本意图置信度的差异调整所述初始模型得到意图匹配度分析模型,所述意图匹配度分析模型用于分析文本与意图的匹配度。
[0008]可选的,所述分析文本与意图的匹配度包括:
[0009]获取多个待分析意图;
[0010]将待分析文本和所述多个待分析意图形成多个待分析数据,一条待分析数据中包括所述待分析文本和一个意图;
[0011]将待分析数据输入所述意图识别模型得到待分析数据对应的匹配度,所述多个待分析数据用于得到多个待分析数据对应的匹配度;
[0012]根据所述多个待分析数据对应的匹配度确定所述待分析文本与所述多个待分析意图的匹配度。
[0013]可选的,所述初始模型包括:
[0014]参数数量大于预设参数数量的初始模型。
[0015]可选的,所述意图匹配度分析模型的训练方法进一步包括:
[0016]将所述意图匹配度分析模型作为教师模型;
[0017]利用所述教师模型的特征提取层初始化学生模型的特征提取层,所述学生模型的特征提取层与所述教师模型的特征提取层具有对应关系;
[0018]将样本数据输入所述学生模型得到样本数据对应的学生待定匹配度与特征提取层中输出的学生特征匹配度,所述学生特征匹配度有对应的教师特征匹配度,所述教师特
征匹配度是通过所述学生模型特征提取层对应的教师模型特征提取层获得的;
[0019]计算所述学生特征匹配度与所述教师特征匹配度的均方误差;
[0020]利用所述均方误差与所述学生待定匹配度得到学生匹配度;
[0021]利用所述学生匹配度与所述样本意图置信度的差异调整所述学生模型得到轻量级意图匹配度分析模型。
[0022]本申请公开了一种意图匹配度分析模型的训练装置,所述装置包括:
[0023]样本数据集获取模块,用于获取样本数据集,所述样本数据集中包括多个样本数据,一条样本数据包括一个文本和一个意图,所述样本数据具有对应的样本意图置信度,所述样本意图置信度用于表示样本数据中文本与意图的匹配程度;
[0024]待定意图置信度获取模块,用于获取待定意图置信度,将样本数据输入初始模型得到样本数据对应的待定意图置信度;
[0025]模型调整模块,用于调整初始模型,利用所述待定意图置信度与所述样本意图置信度的差异调整所述初始模型得到意图匹配度分析模型,所述意图匹配度分析模型用于分析文本与意图的匹配度。
[0026]可选的,所述意图匹配度分析模型的训练装置包括:
[0027]意图获取模块,用于获取多个待分析意图;
[0028]待分析数据生成模块,用于生成待分析数据,将待分析文本和所述多个意图形成多个待分析数据,一条待分析数据中包括所述待分析文本和一个意图;
[0029]待分析数据匹配度生成模块,用于生成待分析数据匹配度,将待分析数据输入所述意图识别模型得到待分析数据对应的匹配度,所述多个待分析数据用于得到多个待分析数据对应的匹配度;
[0030]分析结果确定模块,用于确定意图匹配度分析结果,根据所述多个待分析数据对应的匹配度确定所述待分析文本与所述多个待分析意图的匹配度。
[0031]可选的,所述意图匹配度分析模型的训练装置包括:
[0032]初始模型判断模块,用于判断初始模型的参数数量是否大于预设参数数量。
[0033]可选的,所述意图匹配度分析模型的训练装置进一步包括:
[0034]教师模型确定模块,用于确定教师模型,将所述意图匹配度分析模型作为教师模型;
[0035]学生模型初始化模块,用于初始化学生模型,利用所述教师模型的特征提取层初始化学生模型的特征提取层,所述学生模型的特征提取层与所述教师模型的特征提取层具有对应关系;
[0036]学生匹配度获取模块,用于获取学生匹配度,将样本数据输入所述学生模型得到样本数据对应的学生待定匹配度与特征提取层中输出的学生特征匹配度,所述学生特征匹配度有对应的教师特征匹配度;
[0037]计算模块,用于计算所述学生特征匹配度与所述教师特征匹配度的均方误差;
[0038]学生匹配度确定模块,利用所述均方误差与所述学生待定匹配度得到学生匹配度;
[0039]学生模型调整模块,用于调整学生模型,利用所述学生匹配度与所述样本意图置信度的差异调整所述学生模型得到轻量级意图匹配度分析模型。
[0040]本申请还提供了一种电子设备,包括存储器和处理器,其中:
[0041]所述存储器,用于保存计算机程序;
[0042]所述处理器,用于执行所述计算机程序,以实现上述意图匹配度分析模型的训练方法。
[0043]本申请还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述意图匹配度分析模型的训练方法。
[0044]相较于现有技术,本申请具有以下有益效果:
[0045]现有技术采用预定义好的意图类别训练分类模型,利用分类模型进行意图识别,但是通过这种方式训练出的模型对新出现的,没有进行分类的意图不能进行识别,外延性较差,通过本申请提供的方法训练出的意图匹配度分析模型可以对文本与意图的匹配度进行分析,通过匹配度确定文本的意图识别结果,即使是训练过程中没有出现的意图也可以进行分析匹配度,通过匹配度得到意图识别结果,外延性较强。
[0046]除此之外本申请还有以下有益效果:
[0047]在现有的模型的训练过程中,使用的初始模型参数越多则训练出的模型越准确,但是通过多参数初始模型训练出的模型在实时应用的场景与资源限制的场景无法使用,若使用的初始模型参数较少则训练出模型的性能较差。本申请提供的方法若使用参数较少的初始模型进行训练并使用教师模型进行监督,通过本申请提供的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图匹配度分析模型的训练方法,其特征在于,包括:获取样本数据集,所述样本数据集中包括多个样本数据,一条样本数据包括一个文本和一个意图,所述样本数据具有对应的样本意图置信度,所述样本意图置信度用于表示样本数据中文本与意图的匹配程度;将样本数据输入初始模型得到样本数据对应的待定意图置信度;利用所述待定意图置信度与所述样本意图置信度的差异调整所述初始模型得到意图匹配度分析模型,所述意图匹配度分析模型用于分析文本与意图的匹配度。2.根据权利要求1所述的方法,其特征在于,所述分析文本与意图的匹配度包括:获取多个待分析意图;将待分析文本和所述多个待分析意图形成多个待分析数据,一条待分析数据中包括所述待分析文本和一个意图;将待分析数据输入所述意图识别模型得到待分析数据对应的匹配度,所述多个待分析数据用于得到多个待分析数据对应的匹配度;根据所述多个待分析数据对应的匹配度确定所述待分析文本与所述多个待分析意图的匹配度。3.根据权利要求1所述的方法,其特征在于,所述初始模型包括:参数数量大于预设参数数量的初始模型。4.根据权利要求3所述的方法,其特征在于,所述方法进一步包括:将所述意图匹配度分析模型作为教师模型;利用所述教师模型的特征提取层初始化学生模型的特征提取层,所述学生模型的特征提取层与所述教师模型的特征提取层具有对应关系;将样本数据输入所述学生模型得到样本数据对应的学生待定匹配度与特征提取层中输出的学生特征匹配度,所述学生特征匹配度有对应的教师特征匹配度,所述教师特征匹配度是通过所述学生模型特征提取层对应的教师模型特征提取层获得的;计算所述学生特征匹配度与所述教师特征匹配度的均方误差;利用所述均方误差与所述学生待定匹配度得到学生匹配度;利用所述学生匹配度与所述样本意图置信度的差异调整所述学生模型得到轻量级意图匹配度分析模型。5.一种意图匹配度分析模型的训练装置,其特征在于,包括:样本数据集获取模块,用于获取样本数据集,所述样本数据集中包括多个样本数据,一条样本数据包括一个文本和一个意图,所述样本数据具有对应的样本意图置信度,所述样本意图置信度用于表示样本数据中文本与意图的匹配程度;待定意图置信度获取模块,用于获取待定意图置信度,将样本数据输入初始模型得到样本数据对应的待定意图置信度;模型调整模块,用于调整初始模型,利用...

【专利技术属性】
技术研发人员:刘浪武悦娇任君翔
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1