一种意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号:35702320 阅读:13 留言:0更新日期:2022-11-23 14:56
本发明专利技术公开了一种意图识别方法、装置、设备及存储介质。该方法包括:获取待识别文本;将所述待识别文本输入意图识别模型,得到目标意图,其中,所述意图识别模型通过目标样本集迭代第一模型得到,所述目标样本集包括:文本样本,所述文本样本携带角色标签、谓词情感标签以及至少一个意图标签对应的分数,通过本发明专利技术的技术方案,能够将识别文本中影响意图的角色和谓词情感信息,有效地融入到语义表示中,提高客户问话的表达能力。高客户问话的表达能力。高客户问话的表达能力。

【技术实现步骤摘要】
一种意图识别方法、装置、设备及存储介质


[0001]本专利技术实施例涉及信息处理
,尤其涉及一种意图识别方法、装置、设备及存储介质。

技术介绍

[0002]智能对话是自然语言处理(NLP,natural language processing)领域的重要应用,在金融、通信、电子商务等行业中取得了许多成功案例。对话系统能够帮助企业快速、准确、高效地解决常见的客户高频问题,从而为企业节省大量的客户服务人力成本。
[0003]目前,意图识别主要是通过文本分类来实现的。通过多种特征提取器(CNN,RNN以及transformer等),对客户问话进行语义表示,从而映射到多个意图。
[0004]然而,在应用实践中发现,客户的意图往往较为主观,仅仅使用客户问话的语义表示,难以准确地识别客户的意图。而对于口语中常见的字(例如:“你”,“我”,“是”以及“有”等),本身的语义较为简单,甚至在许多情况下被认为是停用词,却在问话中表达客户完全不同的意图。

技术实现思路

[0005]本专利技术实施例提供一种意图识别方法、装置、设备及存储介质,能够将识别文本中影响意图的角色、谓词情感信息,有效地融入到语义表示中,提高客户问话的表达能力。
[0006]根据本专利技术的一方面,提供了一种意图识别方法,包括:
[0007]获取待识别文本;
[0008]将所述待识别文本输入意图识别模型,得到目标意图,其中,所述意图识别模型通过目标样本集迭代第一模型得到,所述目标样本集包括:文本样本,所述文本样本携带角色标签、谓词情感标签以及至少一个意图标签对应的分数。
[0009]可选的,通过目标样本集迭代第一模型,包括:
[0010]建立第一模型;
[0011]将所述文本样本输入第一模型得到预测角色标签、预测谓词情感以及至少一个预测意图对应的分数;
[0012]根据所述预测角色标签、预测谓词情感、至少一个预测意图对应的分数、文本样本携带的角色标签、谓词情感标签以及至少一个意图标签对应的分数形成的目标函数训练所述第一模型的参数;
[0013]返回执行将所述文本样本输入第一模型得到预测角色标签、预测谓词情感以及至少一个预测意图对应的分数的操作,直至得到意图识别模型。
[0014]可选的,将所述待识别文本输入意图识别模型,得到目标意图,包括:
[0015]对所述待识别文本进行BERT编码,得到所述待识别文本中每个字符对应的语义信息向量和所述待识别文本对应的初始语义信息向量;
[0016]将所述待识别文本中每个字符对应的语义信息向量输入标签确定层,得到待识别
文本对应的第一标签序列;
[0017]根据所述第一标签序列、所述待识别文本中每个字符对应的语义信息向量以及所述待识别文本对应的初始语义信息生成注意力向量;
[0018]将所述注意力向量和所述待识别文本对应的初始语义信息向量进行拼接,得到目标融合向量;
[0019]将所述目标融合向量输入激活层,得到目标意图。
[0020]可选的,根据所述第一标签序列、所述待识别文本中每个字符对应的语义信息向量以及所述待识别文本对应的初始语义信息生成注意力向量,包括:
[0021]基于所述第一标签序列从所述待识别文本中提取目标字符;
[0022]获取所述目标字符对应的语义信息向量;
[0023]根据所述目标字符对应的语义信息向量和所述待识别文本对应的初始语义信息向量确定所述待识别文本中每个字符对应的权重;
[0024]基于权重对目标字符对应的语义信息向量进行加权求和,得到注意力向量。
[0025]可选的,根据目标字符对应的语义信息向量和所述待识别文本对应的初始语义信息向量确定所述待识别文本中每个字符对应的权重,包括:
[0026]将所述待识别文本对应的初始语义信息向量和所述目标字符对应的语义信息向量进行点乘,得到每个字符对应的分数;
[0027]对每个字符对应的分数进行归一化,得到每个字符对应的权重。
[0028]可选的,将所述待识别文本中每个字符对应的向量输入标签确定层,得到待识别文本对应的第一标签序列,包括:
[0029]将所述待识别文本中每个字符对应的向量输入CRF层,得到待识别文本对应的至少一个标签序列的分数;
[0030]将所述待识别文本对应的至少一个标签序列中分数最高的标签序列确定为第一标签序列。
[0031]根据本专利技术的另一方面,提供了一种意图识别装置,包括:
[0032]获取模块,用于获取待识别文本;
[0033]模型输入模块,用于将所述待识别文本输入意图识别模型,得到目标意图,其中,所述意图识别模型通过目标样本集迭代第一模型得到,所述目标样本集包括:文本样本,所述文本样本携带角色标签、谓词情感标签以及至少一个意图标签对应的分数。
[0034]可选的,模型输入模块,具体用于:
[0035]建立第一模型;
[0036]将所述文本样本输入第一模型得到预测角色标签、预测谓词情感以及至少一个预测意图对应的分数;
[0037]根据所述预测角色标签、预测谓词情感、至少一个预测意图对应的分数、文本样本携带的角色标签、谓词情感标签以及至少一个意图标签对应的分数形成的目标函数训练所述第一模型的参数;
[0038]返回执行将所述文本样本输入第一模型得到预测角色标签、预测谓词情感以及至少一个预测意图对应的分数的操作,直至得到意图识别模型。
[0039]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0040]至少一个处理器;以及
[0041]与所述至少一个处理器通信连接的存储器;其中,
[0042]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的意图识别方法。
[0043]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的意图识别方法。
[0044]本专利技术实施例通过获取待识别文本;将所述待识别文本输入意图识别模型,得到目标意图,其中,所述意图识别模型通过目标样本集迭代第一模型得到,所述目标样本集包括:文本样本,所述文本样本携带角色标签、谓词情感标签以及至少一个意图标签对应的分数,通过本专利技术的技术方案,能够将识别文本中影响意图的角色、谓词情感信息,有效地融入到语义表示中,提高客户问话的表达能力。
[0045]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0046]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:获取待识别文本;将所述待识别文本输入意图识别模型,得到目标意图,其中,所述意图识别模型通过目标样本集迭代第一模型得到,所述目标样本集包括:文本样本,所述文本样本携带角色标签、谓词情感标签以及至少一个意图标签对应的分数。2.根据权利要求1所述的方法,其特征在于,通过目标样本集迭代第一模型,包括:建立第一模型;将所述文本样本输入第一模型得到预测角色标签、预测谓词情感以及至少一个预测意图对应的分数;根据所述预测角色标签、预测谓词情感、至少一个预测意图对应的分数、文本样本携带的角色标签、谓词情感标签以及至少一个意图标签对应的分数形成的目标函数训练所述第一模型的参数;返回执行将所述文本样本输入第一模型得到预测角色标签、预测谓词情感以及至少一个预测意图对应的分数的操作,直至得到意图识别模型。3.根据权利要求1所述的方法,其特征在于,将所述待识别文本输入意图识别模型,得到目标意图,包括:对所述待识别文本进行BERT编码,得到所述待识别文本中每个字符对应的语义信息向量和所述待识别文本对应的初始语义信息向量;将所述待识别文本中每个字符对应的语义信息向量输入标签确定层,得到待识别文本对应的第一标签序列;根据所述第一标签序列、所述待识别文本中每个字符对应的语义信息向量以及所述待识别文本对应的初始语义信息生成注意力向量;将所述注意力向量和所述待识别文本对应的初始语义信息向量进行拼接,得到目标融合向量;将所述目标融合向量输入激活层,得到目标意图。4.根据权利要求3所述的方法,其特征在于,根据所述第一标签序列、所述待识别文本中每个字符对应的语义信息向量以及所述待识别文本对应的初始语义信息生成注意力向量,包括:基于所述第一标签序列从所述待识别文本中提取目标字符;获取所述目标字符对应的语义信息向量;根据所述目标字符对应的语义信息向量和所述待识别文本对应的初始语义信息向量确定所述待识别文本中每个字符对应的权重;基于权重对目标字符对应的语义信息向量进行加权求和,得到注意力向量。5.根据权利要求4所述的方法,其特征在于,根据目标字符对应的语义信息向量和所述待识别文本对应...

【专利技术属性】
技术研发人员:黄健郭林海张琛万化
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1