意图识别方法、装置、计算设备及存储介质制造方法及图纸

技术编号:28942897 阅读:12 留言:0更新日期:2021-06-18 21:50
本申请公开了一种意图识别方法,该方法包括:获取用户回答文本,其中,用户回答文本对应一个目标意图问题;将用户回答文本输入意图识别模型的目标分层加权层,获得加权特征向量,其中,意图识别模型包括多个分层加权层和多个分类层,目标分层加权层与用户回答文本的目标意图问题存在对应关系;将加权特征向量输入意图识别模型的目标分类层,得到用户回答文本的分类结果,其中,目标分类层与用户回答文本的目标意图问题存在对应关系。本申请实施例通过对特征提取层的M维特征向量进行加权求和,再将得到的加权特征向量输入到目标意图问题对应的分类层中,提升了意图识别的准确率。

【技术实现步骤摘要】
意图识别方法、装置、计算设备及存储介质
本申请涉及人工智能(artificialintelligence,AI)
,尤其涉及一种意图识别方法、装置、计算设备及存储介质。
技术介绍
意图识别是自然语言处理(naturelanguageprocess,NLP)中的一项子任务,简单来说,就是通过分类的办法将句子分到相应的候选意图中。意图识别常见于任务型对话系统、AI面试等场景。例如,对话系统提出某个问题,然后用户给出了一句回答,系统则需要通过这句回答识别出用户的意图,以便进行回复或者开启下一轮对话。在一个对话场景或AI面试场景中,系统往往会有很多个意图问题,而每个意图问题对应的候选意图集也不一样,所以要分别对每个意图问题的用户回答进行意图识别。在上述具有多个意图问题的场景下,往往是一个意图问题对应一个BERT模型,导致系统需要的模型数量较多、硬件资源消耗大,而且意图识别的准确率不够高。
技术实现思路
本申请实施例提供了一种意图识别方法、装置、计算设备及存储介质,实现了多个意图问题场景下的意图识别,通过对特征提取层输出的M维特征向量进行加权求和,充分利用了特征提取层中的不同网络层所提取的信息,提升了意图识别的准确率,而且需要的模型数量少,减少了资源消耗。第一方面,本申请提供了一种意图识别方法,该方法包括:获取用户回答文本,其中,用户回答文本对应一个目标意图问题;将用户回答文本输入意图识别模型的目标分层加权层,获得加权特征向量,其中,意图识别模型包括多个分层加权层和多个分类层,目标分层加权层与用户回答文本的目标意图问题存在对应关系;将加权特征向量输入意图识别模型的目标分类层,得到用户回答文本的分类结果,其中,目标分类层与用户回答文本的目标意图问题存在对应关系。第二方面,本申请提供了一种意图识别装置,该装置包括:获取模块,用于获取用户回答文本,其中,用户回答文本对应一个目标意图问题;处理模块,用于将用户回答文本输入意图识别模型的目标分层加权层,获得加权特征向量,其中,意图识别模型包括多个分层加权层和多个分类层,目标分层加权层与用户回答文本的目标意图问题存在对应关系;处理模块还用于,将加权特征向量输入意图识别模型的目标分类层,得到用户回答文本的分类结果,其中,目标分类层与用户回答文本的目标意图存在对应关系。第三方面,本申请提供了一种计算设备,包括处理器和存储器,所述处理器和存储器可通过总线相互连接,也可以集成在一起。该处理器执行存储器中存储的代码实现如第一方面所描述的方法。第四方面,本申请提供了一种计算机可读存储介质,包括程序或指令,当上述程序或指令在计算机设备上运行时,可使上述计算机设备执行如第一方面所描述的方法。可以看到,本申请实施例通过将特征提取层的M维特征向量输入目标分层加权层中进行加权求和,然后将得到的加权特征向量输入目标分类层,获得最终的分类结果。由于特征提取层的不同网络层的侧重点不同、所提取的信息不同,因此,该方法通过加权求和充分利用了特征提取层不同层的特征表征能力,综合了不同层所提取的信息,从而提升了意图识别的准确率。该方法在具有多个意图问题的场景下,也只需要使用一个特征提取层,不同意图问题的用户回答都可以通过同一个特征提取层进行特征提取,减小了模型规模,而且仅需要一个意图识别模型,减少了模型数量,降低了模型管理难度,硬件资源消耗小。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种意图识别场景的示意图;图2是本申请实施例提供的一种意图识别模型的示意图;图3是本申请实施例提供的一种意图识别方法的流程示意图;图4是本申请实施例提供的一种意图识别装置的结构示意图;图5是本申请实施例提供的一种计算设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。自然语言处理是AI的一个子领域,意图识别又是自然语言处理中的一项子任务。意图识别常见于各种人机交互场景中,图1是本申请实施例提供的一种意图识别场景的示意图,用户正通过电子设备100进行AI面试。电子设备100显示AI面试界面101,AI面试界面101中包括机器人面试官102、文本框103以及录音控件104。其中,机器人面试官102用于表示虚拟面试官的人物形象,此虚拟人物形象可以随着当前问题或者用户的回答等做出相应的变化;文本框103用于显示当前面试问题的文字内容以及显示回复内容等等;录音控件104用于开启录音,然后录制用户的回答语音。例如,电子设备响应于用户针对录音控件104的点击操作,电子设备开始录音,然后获得针对当前面试问题的一段用户回答语音。可以理解的是,除了上述语音输入操作,用户还可以直接输入针对当前面试问题的一段回答文本,本申请不作具体限定。需要说明的是,图1仅是为了便于理解本申请实施例,电子设备100除了是手机,还可以是笔记本电脑、平板电脑等电子设备,本申请不作限定,而且,AI界面101中还可以包括更多或更少的控件,显示的内容也不限定。在图1所示的AI面试场景中,机器人面试官102会逐一询问用户多个问题,并在文本框103中显示当前的面试问题,针对这些问题可能会收到多种用户回答,用户回答是与某个具体问题对应的。针对不同的用户回答如何给出较为准确的回复,系统就需要对用户的意图进行识别。将这些需要进行意图识别的问题称为意图问题,每个意图问题都会对应一个候选意图集,候选意图集中包括多个候选意图。简单来说,意图识别就是将用户回答文本分到意图问题的某个候选意图中,以便进行后续的操作,比如说针对用户的回答给出相应的回复,回复内容显示在文本框103中。在上述具有多个意图问题的意图识别场景中,通常是一个意图问题用一个意图识别模型,需要的模型数量多,如果意图问题数量较多,对应的模型数量同样较多,同时会带来模型难以管理等问题。意图识别模型通常需要运行在图形处理器(graphicsprocessingunit,GPU)上,而一块GPU显存有限,能够运行的模型也有限,大量模型就需要大量的GPU,导致整个意图识别系统的硬件资源消耗过大、总体成本过高。而传统的意图识本文档来自技高网...

【技术保护点】
1.一种意图识别方法,其特征在于,所述方法包括:/n获取用户回答文本,其中,所述用户回答文本对应一个目标意图问题;/n将所述用户回答文本输入意图识别模型的目标分层加权层,获得加权特征向量,其中,所述意图识别模型包括多个分层加权层和多个分类层,所述目标分层加权层与所述用户回答文本的目标意图问题存在对应关系;/n将所述加权特征向量输入所述意图识别模型的目标分类层,得到所述用户回答文本的分类结果,其中,所述目标分类层与所述用户回答文本的目标意图问题存在对应关系。/n

【技术特征摘要】
1.一种意图识别方法,其特征在于,所述方法包括:
获取用户回答文本,其中,所述用户回答文本对应一个目标意图问题;
将所述用户回答文本输入意图识别模型的目标分层加权层,获得加权特征向量,其中,所述意图识别模型包括多个分层加权层和多个分类层,所述目标分层加权层与所述用户回答文本的目标意图问题存在对应关系;
将所述加权特征向量输入所述意图识别模型的目标分类层,得到所述用户回答文本的分类结果,其中,所述目标分类层与所述用户回答文本的目标意图问题存在对应关系。


2.根据权利要求1所述的方法,其特征在于,所述将所述用户回答文本输入意图识别模型的目标分层加权层,获得加权特征向量,包括:
将所述用户回答文本输入特征提取层,输出M维特征向量,其中,所述特征提取层包括M个网络层,所述M个网络层中的每个网络层输出一个维度的特征向量,所述M为整数;
将所述M维特征向量输入所述意图识别模型的所述目标分层加权层,获得所述加权特征向量。


3.根据权利要求2所述的方法,其特征在于,在所述获取用户回答文本之前,所述方法还包括:
获取第一样本集,其中,所述第一样本集包括已知M维特征向量和对应的已知文本分类结果;
使用所述第一样本集对第一神经网络进行训练后获得所述意图识别模型。


4.根据权利要求3所述的方法,其特征在于,所述使用所述第一样本集对第一神经网络进行训练后获得所述意图识别模型,包括:
将所述已知M维特征向量输入所述第一神经网络的分层加权层进行加权求和,获得加权特征向量;
将所述加权特征向量输入所述第一神经网络的分类层,得到预测值;
由所述预测值和所述已知文本分类结果之间的差距获得损失,通过所述损失对所述第一神经网络进行反向传播,调整所述第一神经网络的所述分层加权层和所述分类层的参数,获得所述意图识别模型的所述分层加权层和所述分类层。


5.根据权利要求2所述的方法,其特征在于,在所述获取用户回答文本之前,所述方法还包括:
获取第二样本集,其中,所述第二样本集包括已知用户回答文本和对应的已知文本分类结果;
使用所述第二样本集对第二神经网络进行训练后获得所述意图识别模型。


6....

【专利技术属性】
技术研发人员:陆凯赵知纬高维国
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1