【技术实现步骤摘要】
一种剔除干扰问题对的方法及系统
本说明书实施例涉及数据处理领域,特别涉及一种剔除干扰问题对的方法、系统。
技术介绍
随着计算机技术的发展,自动问答系统在生活中越来越普遍,为人们的生活带来了多种便利。例如通过识别用户输入的文字和/或语音问题,自动回复与该问题对应的答案,从而解决用户的疑问和需求。通常,从线上获取的大量问题对中存在一些干扰问题对。例如,从线上获取保险类的问题对中可能会存在金融类的问题对。在应用这些获取的问题时,干扰问题对可能会产生不利影响。因此,如何有效地剔除干扰问题对成为目前亟需解决的技术问题。
技术实现思路
本说明书实施例的一个方面提供一种剔除干扰问题对的方法,所述方法包括:获取至少一个问题对,将所述至少一个问题对输入初始剔除模型,剔除所述至少一个问题对中的干扰问题对;所述干扰问题对是指与目标主题不相关的问题对;将所述至少一个问题对中未剔除的第一问题对输入匹配模型,确定所述第一问题对的第一匹配结果;基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果,得到反馈值;根据所述反馈值 ...
【技术保护点】
1.一种剔除干扰问题对的方法,包括:/n获取至少一个问题对,将所述至少一个问题对输入初始剔除模型,剔除所述至少一个问题对中的干扰问题对;所述干扰问题对是指与目标主题不相关的问题对;/n将所述至少一个问题对中未剔除的第一问题对输入匹配模型,确定所述第一问题对的第一匹配结果;/n基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果,得到反馈值;/n根据所述反馈值调整所述初始剔除模型,得到目标剔除模型,采用所述目标剔除模型剔除目标问题对中的干扰问题对。/n
【技术特征摘要】
1.一种剔除干扰问题对的方法,包括:
获取至少一个问题对,将所述至少一个问题对输入初始剔除模型,剔除所述至少一个问题对中的干扰问题对;所述干扰问题对是指与目标主题不相关的问题对;
将所述至少一个问题对中未剔除的第一问题对输入匹配模型,确定所述第一问题对的第一匹配结果;
基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果,得到反馈值;
根据所述反馈值调整所述初始剔除模型,得到目标剔除模型,采用所述目标剔除模型剔除目标问题对中的干扰问题对。
2.如权利要求1所述的方法,所述基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果,得到反馈值包括:
判断所述第一问题对中每一个的所述第一匹配结果和所述第二匹配结果是否一致;
基于所述判断结果,计算所述匹配模型的准确值;
将所述准确值确定为所述反馈值。
3.如权利要求2所述的方法,所述准确值为所述匹配模型的F-1分数,所述F-1分数是综合准确率和召回率的模型综合评价指标。
4.如权利要求1所述的方法,所述根据所述反馈值调整所述初始剔除模型,得到目标剔除模型包括:
基于所述初始剔除模型的第一损失函数和所述反馈值,调整所述初始剔除模型的参数,当调整后的中间剔除模型当前的损失函数第二损失函数满足第一预设条件,确定当前中间剔除模型为所述目标剔除模型。
5.如权利要求1所述的方法,所述匹配模型通过以下训练方式获得:
获取多个样本对,所述样本对为问题对;
剔除所述多个样本对中的干扰样本对,将未剔除的第二样本对输入初始匹配模型进行训练,获得所述匹配模型。
6.如权利要求5所述的方法,还包括:
当所述多个样本对全部被剔除时,随机选择部分所述多个样本输入所述初始匹配模型。
7.如权利要求1所述的方法,将输入所述匹配模型的所述问题对进行向量表示。
8.如权利要求1所述的方法,所述初始剔除模型为二分类模型。
9.一种剔除模型的训练方法,包括:
获取至少一个问题对,将所述至少一个问题对输入初始剔除模型,剔除所述至少一个问题对中的干扰问题对;所述干扰问题对是指与目标主题不相关的问题对;
将所述至少一个问题对中未剔除的第一问题对输入匹配模型,确定所述第一问题对的第一匹配结果;
基于所述第一...
【专利技术属性】
技术研发人员:陈晓军,崔恒斌,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。