意图识别方法及装置制造方法及图纸

技术编号:35454755 阅读:13 留言:0更新日期:2022-11-03 12:11
本申请提供意图识别方法及装置,其中所述意图识别方法包括:获取目标对话文本,并将目标对话文本切分为至少两个文本片段;将至少两个文本片段输入至意图识别模型,其中,意图识别模型包括编码单元、解码单元;通过编码单元对至少两个文本片段依次进行编码处理,获得编码向量,其中,编码向量由每个文本片段融合扩展信息编码获得的编码子向量组成;通过解码单元对编码向量进行解码处理,获得目标对话文本对应的意图类别概率分布并输出意图识别模型。通过采用意图识别模型依次处理各个文本片段,使每个文本片段融合扩展信息再进行编码处理,实现扩展上下文的目的,能够较好的捕捉整段目标对话文本的语义信息,从而提高用户意图预测的准确率。的准确率。的准确率。

【技术实现步骤摘要】
意图识别方法及装置


[0001]本申请涉及人工智能
,特别涉及意图识别方法。本申请同时涉及意图识别装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着人工神经网络技术的发展,人工神经网络的构建和训练,可以解决较为复杂的逻辑策略的表达问题。目前,预训练语言模型可以用于文本分类任务,例如使用预训练语言模型基于用户对话预测用户意向,从而判断用户是否会流失。但是,目前预训练语言模型在对话场景下,无法对长对话一次性编码,导致模型训练效率较低以及预测结果不准确的问题。因此,如何在长对话场景下准确预测出用户意向是目前亟需解决的问题。

技术实现思路

[0003]有鉴于此,本申请实施例提供了意图识别方法,基于长对话文本准确预测出用户的意图,从而为用户提供相应服务,提高用户满意度。本申请同时涉及意图识别装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的无法在长对话场景下准确预测出用户意图。
[0004]根据本申请实施例的第一方面,提供了一种意图识别方法,包括:
[0005]获取目标对话文本,并将所述目标对话文本切分为至少两个文本片段;
[0006]将所述至少两个文本片段输入至意图识别模型,其中,所述意图识别模型包括编码单元、解码单元;
[0007]通过所述编码单元对所述至少两个文本片段依次进行编码处理,获得编码向量,其中,所述编码向量由每个文本片段融合扩展信息编码获得的编码子向量组成;
[0008]通过所述解码单元对所述编码向量进行解码处理,获得所述目标对话文本对应的意图类别概率分布并输出所述意图识别模型。
[0009]根据本申请实施例的第二方面,提供了一种意图识别装置,包括:
[0010]切分模块,被配置为获取目标对话文本,并将所述目标对话文本切分为至少两个文本片段;
[0011]输入模块,被配置为将所述至少两个文本片段输入至意图识别模型,其中,所述意图识别模型包括编码单元、解码单元;
[0012]编码模块,被配置为通过所述编码单元对所述至少两个文本片段依次进行编码处理,获得编码向量,其中,所述编码向量由每个文本片段融合扩展信息编码获得的编码子向量组成;
[0013]解码模块,被配置为通过所述解码单元对所述编码向量进行解码处理,获得所述目标对话文本对应的意图类别概率分布并输出所述意图识别模型。
[0014]根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述计算机指令时实现所
述意图识别方法的步骤。
[0015]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现所述意图识别方法的步骤。
[0016]本申请提供的意图识别方法,获取目标对话文本,并将所述目标对话文本切分为至少两个文本片段;将所述至少两个文本片段输入至意图识别模型,其中,所述意图识别模型包括编码单元、解码单元;通过所述编码单元对所述至少两个文本片段依次进行编码处理,获得编码向量,其中,所述编码向量由每个文本片段融合扩展信息编码获得的编码子向量组成;通过所述解码单元对所述编码向量进行解码处理,获得所述目标对话文本对应的意图类别概率分布并输出所述意图识别模型。
[0017]本申请一实施例实现了通过将目标对话文本切分为多个文本片段,采用意图识别模型依次处理各个文本片段,在处理过程中,使每个文本片段融合扩展信息再进行编码处理,实现扩展上下文的目的,能够较好的捕捉整段目标对话文本的语义信息,从而提高用户意图预测的准确率。
附图说明
[0018]图1是本申请一实施例提供的一种意图识别方法的结构示意图;
[0019]图2是本申请一实施例提供的一种意图识别方法的流程图;
[0020]图3是本申请一实施例中目标对话文本的切分示意图;
[0021]图4是本申请一实施例提供的一种应用于课程续报意图识别的意图识别方法的处理流程图;
[0022]图5是本申请一实施例提供的一种意图识别装置的结构示意图;
[0023]图6是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
[0024]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0025]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0026]应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0027]首先,对本申请一个或多个实施例涉及的名词术语进行解释。
[0028]意向预测:意向预测任务即意图识别,是根据一段通话记录,识别出用户的意图类
别,例如,根据老师与家长的对话,识别出家长对于老师教课水平的满意度。
[0029]文本分类:文本分类是自然语言处理的经典任务,任务是按照一定的分类体系或标准将文本分配到其所属类别中。基于神经网络模型,给定标注好的数据,经过训练后的模型能够预测文本的类别。
[0030]BERT:Bidirectional Encoder Representation from Transformers,是一个预训练的语言表征模型,用于自然语言处理,能够通过编码文本的双向信息,获取文本的向量表示。
[0031]XLNet:基于transformer

XL的XLNet是目前在BERT基础上改动较大的模型,在超长文本的场景下,XLNet相比其他bert系列的模型会有更好的性能。
[0032]随着信息技术的发展,数据挖掘引起了信息产业界的关注,通过数据挖掘可以从大量数据中获取到有用的信息。例如,在销售场景下,若是可以从销售人员与顾客的对话中挖掘出顾客的购买意向或者对于商品的喜爱度,那么销售人员则可以针对性地为顾客提供相关介绍,使顾客能够更清楚的获取到自己喜欢的商品的信息,提高顾客的满意度。传统的,对于顾客的购买意向只能通过销售人员的主观评判,判断结果差异较大、准确率低,并没有客观的数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:获取目标对话文本,并将所述目标对话文本切分为至少两个文本片段;将所述至少两个文本片段输入至意图识别模型,其中,所述意图识别模型包括编码单元、解码单元;通过所述编码单元对所述至少两个文本片段依次进行编码处理,获得编码向量,其中,所述编码向量由每个文本片段融合扩展信息编码获得的编码子向量组成;通过所述解码单元对所述编码向量进行解码处理,获得所述目标对话文本对应的意图类别概率分布并输出所述意图识别模型。2.如权利要求1所述的方法,其特征在于,获取目标对话文本,包括:获取关联目标业务的对话信息集;对所述对话信息集中包含的初始对话信息进行数据清洗,获得包含目标对话信息的目标对话信息集;确定所述目标对话信息集中目标对话信息对应的至少两个对话文本,通过对所述至少两个对话文本进行拼接,获得所述目标对话文本,其中,至少两个对话文本中的每个对话文本均包含讲话者标识。3.如权利要求2所述的方法,其特征在于,对所述对话信息集中包含的初始对话信息进行数据清洗,获得包含目标对话信息的目标对话信息集,包括:确定包含多个数据清洗节点的数据清洗链路;在所述数据清洗链路中选择第i数据清洗节点对应的数据清洗规则,对所述对话信息集中包含的初始对话信息进行数据清洗,获得初始对话信息集;判断所述数据清洗链路中是否包含未执行的数据清洗节点;若是,i自增1,将所述初始对话信息集作为对话信息集,并执行在所述数据清洗链路中选择第i数据清洗节点对应的数据清洗规则的步骤;若否,将所述初始对话信息集作为包含目标对话信息的目标对话信息集。4.如权利要求1所述的方法,其特征在于,将所述目标对话文本切分为至少两个文本片段,包括:获取预设切分策略,并根据所述预设切分策略确定切分窗口;根据所述切分窗口对所述目标对话文本进行切分处理,获得至少两个文本片段。5.如权利要求1所述的方法,其特征在于,通过所述编码单元对所述至少两个文本片段依次进行编码处理,获得编码向量,包括:获取所述至少两个文本片段中每个文本片段之间的排列顺序;通过所述编码单元按照所述排列顺序依次对每个文本片段进行编码处理,获得每个文本片段对应的编码子向量;根据每个文本片段对应的编码子向量组成获得编码向量。6.如权利要求5所述的方法,其特征在于,所述通过所述编码单元对所述至少两个文本片段依次进行编码处理,获得编码向量,包括:在所述至少两个文本片段中确定第i个文本片段,以及确定所述第i个文本片段对应的扩展信息,其中,第i个文本片段对应的扩展信息由第i

1个文本片段编码获得;融合所述第i个文本片段和所述第i个文本片段对应的扩展信息,并通过编码单元对融
合结果进行编码处理,获得所述第i个文本片段对应的编码子向量和第i+1个文本片段对应的扩展信息;判断所述至少两...

【专利技术属性】
技术研发人员:阎覃孙子钧张天宇赵薇柳景明
申请(专利权)人:北京飞象星球科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1