一种意图识别模型的学习方法、装置及设备制造方法及图纸

技术编号:26896421 阅读:65 留言:0更新日期:2020-12-29 16:24
一种意图识别模型的学习方法、装置及设备,涉及通信技术领域,有利于提升人机对话系统中意图识别模型的准确性,提升人机对话系统执行任务的准确性,提升用户体验,该方法包括:服务器接收技能开发者输入的第一技能对应的正向数据(S101);服务器根据第一技能对应的正向数据,生成第一技能对应的负向数据(S102);服务器确定与第一技能相似的第二技能(S103);服务器获取各个第二技能对应的数据(S104);服务器根据第二技能对应的数据,以及服务器存储的第一基模型生成第二基模型(S105);服务器根据第一技能对应的正向数据和负向数据,以及第二基模型进行学习(S106),生成意图识别模型。

【技术实现步骤摘要】
【国外来华专利技术】一种意图识别模型的学习方法、装置及设备
本申请涉及通信
,尤其涉及一种意图识别模型的学习方法、装置及设备。
技术介绍
人机对话系统,或称之为人机对话平台、聊天机器人(chatbot)等,是新一代的人机交互界面。具体的,人机对话系统按照涉及的领域,分为开放域(open-domain)的chatbot和面向具体任务(task-oriented)的chatbot。其中,面向具体任务的chatbot可以实现为终端用户提供例如订餐、订票、打车等的服务的功能。例如:这些服务的提供商预先在服务器中输入一些功能A对应训练数据(例如:用户说法,也可称之为语料),服务器根据输入的训练数据,采用集成学习(EnsembleLearning)的方法,训练出功能A对应的模型。该功能A对应的模型可用于对终端用户输入的新的用户说法进行预测,以确定用户的意图,即服务器是否为该终端用户提供功能A对应的服务。需要说明的是,在服务器的集成学习的过程中,服务器使用一些预先设定的基学习器(也可称之为基模型),对服务提供商输入的训练数据进行学习,并使用某种规则把各个基学习器的本文档来自技高网...

【技术保护点】
一种意图识别模型的学习方法,其特征在于,所述方法包括:/n服务器接收技能开发者输入的第一技能中各个意图对应的正向数据;/n所述服务器根据所述第一技能中各个意图对应的正向数据生成所述第一技能中各个意图对应的负向数据;/n所述服务器获取第二技能对应的训练数据,所述第二技能为与所述第一技能相似的技能,所述第二技能的数量为至少一个;/n所述服务器根据所述第二技能对应的训练数据,以及预先设置的第一基模型进行学习,生成第二基模型,所述第二基模型的数量为至少一个;/n所述服务器根据所述第一技能中各个意图对应的正向数据和所述第一技能中各个意图对应的负向数据,以及所述第二基模型进行学习,生成意图识别模型。/n

【技术特征摘要】
【国外来华专利技术】一种意图识别模型的学习方法,其特征在于,所述方法包括:
服务器接收技能开发者输入的第一技能中各个意图对应的正向数据;
所述服务器根据所述第一技能中各个意图对应的正向数据生成所述第一技能中各个意图对应的负向数据;
所述服务器获取第二技能对应的训练数据,所述第二技能为与所述第一技能相似的技能,所述第二技能的数量为至少一个;
所述服务器根据所述第二技能对应的训练数据,以及预先设置的第一基模型进行学习,生成第二基模型,所述第二基模型的数量为至少一个;
所述服务器根据所述第一技能中各个意图对应的正向数据和所述第一技能中各个意图对应的负向数据,以及所述第二基模型进行学习,生成意图识别模型。


根据权利要求1所述的意图识别模型的学习方法,其特征在于,所述服务器根据所述第一技能中各个意图对应的正向数据生成所述第一技能中各个意图对应的负向数据包括:
所述服务器针对所述第一技能中各个意图,分别抽取出所述第一技能中各个意图对应的关键词,其中,所述关键词为影响所述第一基模型权重的关键特征;
将所述第一技能中不同意图对应的关键词进行组合,或者,将不同意图对应的关键词与非所述第一技能相关的词进行组合,组合后的词确定为所述不同意图对应的负向数据。


根据权利要求1或2所述的意图识别模型的学习方法,其特征在于,所述服务器根据所述第一技能中各个意图对应的正向数据生成所述第一技能中各个意图对应的负向数据还包括:
所述服务器根据所述第一技能的分类,从服务器上存储的训练数据的全集中确定出第一集合,所述第一集合中的训练数据包含与所述第一技能中各个意图对应的负向数据;其中,训练数据包括正向数据和负向数据;
从所述第一集合中采样预设数量的训练数据;
采用人工标注和/或聚类算法,从采样得到的训练数据中,确定出与所述第一技能中各个意图对应的负向数据。


根据权利要求1-3任一项所述的意图识别模型的学习方法,其特征在于,所述服务器获取第二技能对应的数据包括:
所述服务器根据所述第一技能的分类,和/或所述第一技能的正向数据,确定所述第二技能;
通过共享层获取所述第二技能对应的训练数据。


根据权利要求1-4任一项所述的意图识别模型的学习方法,其特征在于,所述服务器根据所述第二技能对应的训练数据,以及预先设置的第一基模型进行学习,生成第二基模型包括:
所述服务器根据所述第二技能对应的训练数据,以及预先设置的第一基模型,采用多任务学习方法进行学习,生成第二基模型。


根据权利要求1-5任一项所述的意图识别模型的学习方法,其特征在于,所述服务器根据所述第一技能中各个意图对应的正向数据和所述第一技能中各个意图对应的负向数据,以及所述第二基模型进行学习,生成意图识别模型包括:
所述服务器根据所述第一技能中各个意图对应的正向数据和所述第一技能中各个意图对应的负向数据,以及所述第二基模型,采用集成学习的方法进行学习,生成意图识别模型。


根据权利要求6所述的意图识别模型的学习方法,其特征在于,所述服务器生成意图识别模型具体包括:
所述服务器在生成所述意图识别模型的过程中,生成多个中间模型;
所述服务器确定最先生成的中间模型为最快的意图识别模型;和/或,所述服务器对所述多个中间模型进行模型选择以及参数调整后,确定出最佳的意图识别模型。


根据权利要求7所述的意图识别模型的学习方法,其特征在于,所述服务器确定出最佳的意图识别模型包括:
所述服务器根据所述第一技能中各个意图对应的正向数据计算出各个中间模型的第一准确率;所述服务器根据所述第一技能中各个意图对应的负向数据计算出各个中间模型的第二准确率;
所述服务器根据所述第一准确率、所述第二准确率,以及技能开发者输入的权重,对所述多个中间模型进行模型选择以及参数调整后,确定出最佳的意图识别模型。


...

【专利技术属性】
技术研发人员:张晴杨威肖一凡张良和芮祥麟
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1