一种意图识别方法及装置制造方法及图纸

技术编号:29309280 阅读:23 留言:0更新日期:2021-07-17 02:07
本申请提供了一种意图识别方法及装置,该方法包括:使用预设模型对同一句子预测M次;将每次预测获得的意图类别信心值P

An intention recognition method and device

【技术实现步骤摘要】
一种意图识别方法及装置


[0001]本申请涉及人工智能领域,特别涉及一种意图识别方法及装置。

技术介绍

[0002]在人机对话的过程中,输入至机器的句子往往会包含长句子,而长句子往往会包含多个意图。因此,长句子容易造成机器学习模型不能判断出句子中所有的意图,最终导致句子经过机器学习模型预测所输出的意图类别不完整。在这种情况下,机器无法精准识别出长句子中的意图,进而无法根据句子中的意图进行相应的对话,即使可以对话,但出现错误的可能性也极大。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种意图识别方法,可以解决无法精准识别长句子中所包含的多个意图的问题。
[0004]本申请实施例提供的了一种意图识别方法,包括:使用预设模型对同一句子预测M次;将每次预测获得的意图类别信心值P
i
和无意图类别的信心值TH比较,保留P
i
>TH的意图类别;将所述保留的意图类别信心值进行调分,获得信心分数。
[0005]在一个实施例中,所述使用预设模型对同一句子预测M次之前,包括:将用户输入的语料和无意图语料一同训练,获得所述预设模型;其中,所述无意图语料为在用户人机对话的历史日志中随机抽取的无意图的句子;所述预设模型的输出为意图类别和无意图类别的信心值,所述信心值为意图类别和无意图类别的机率分布。
[0006]在一个实施例中,所述预设模型每次预测获得的P
i
与TH之和为1。
[0007]在一个实施例中,所述使用预设模型对同一句子预测M次,包括:抽取所述句子中长度为N的子字串,共抽取M次;使用所述预设模型分别对所述子字串进行预测。
[0008]在一个实施例中,所述抽取所述句子中长度为N的子字串,共抽取M次,包括:抽取所述句子中第一个字到第N个字作为第一子字串;位移W个字,抽取所述句子中第W个字到第N+W个字作为第二子字串,重复该步骤直至子字串的长度小于等于N,该子字串为第M子字串。
[0009]在一个实施例中,所述将所述保留的意图类别信心值进行调分,获得信心分数,包括:将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Q
i
;对Q
i
进行调分,获得信心分数F(Q
i
)。
[0010]在一个实施例中,所述Q
i
=(P
i

1/K
i
)*K
i
,其中,K
i
为每次预测获得的意图类别和无意图类别的类别总数。
[0011]在一个实施例中,所述F(Q
i
)=1/(1+e

Qi/2
),其中,e为自然常数。
[0012]在一个实施例中,所述将所述保留的意图类别信心值进行调分,获得信心分数之后,包括:当所述保留的意图类别中存在相同意图类别时,保留信心分数高的意图类别。
[0013]本申请实施例提供了一种意图识别装置,包括:预测模块,用于使用预设模型对同
一句子预测M次;比较模块,用于将每次预测获得的意图类别信心值P
i
和无意图类别的信心值TH比较,保留P
i
>TH的意图类别;调分模块,用于将所述保留的意图类别信心值进行调分,获得信心分数。
[0014]本申请上述实施例提供的技术方案,通过使用适当的预设模型对长句子进行多次预测,剔除信心值低于无意图类别的意图,保留下的意图类别可以完整体现出长句子所包含的意图。同时,通过对保留下来的意图类别信心值进行调分,经过调分后的信心值能够适当反映出各意图类别信心值的差异,有利于人机对话系统中机器能更精准的出话,提高机器的智能程度。
附图说明
[0015]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本申请的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本申请的主旨。
[0016]图1为本申请实施例提供的模型训练方法的流程示意图;
[0017]图2为本申请另一实施例提供的模型训练方法的流程示意图;
[0018]图3为本申请另一实施例提供的模型训练方法的流程示意图;
[0019]图4为本申请实施例提供的模型训练装置的框图。
[0020]图5为本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0021]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
[0022]相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0023]在人机对话的真实系统中,在用户和机器对话的过程里,用户输入长句子的可能性很大,用户会在一个句子中表达多个意图。如果按通常的方式,通过模型预测出长句子的意图,极有可能导致部分意图类别无法被预测到。
[0024]另外,人机对话的真实系统中一般会设定信心阈值,只有信心值达到信心阈值的意图才会作为模型预测的结果输出,这样那些不能体现用户真实意图的意图类别可被剔除。但是,由于长句子往往包含多个意图,就导致预测的信心值容易过低,并且各个意图的信心值直接差异很小,导致真实场景下无法确定合适的信心阈值。
[0025]基于上述情况,对于用户输入的长句子,由于无法准确的预测其中包含的意图,机器就无法给出精准的应答,整个人机对话系统智能程度较低。
[0026]为了解决上述问题,需要改变模型对句子预测的方式,并且对预测结果进行调分。本申请实施例提供了一种意图识别方法、装置、电子设备及计算机可读存储介质,以实现精准的获得用户在长句子中所表达的意图类别,同时为后续机器出话提供了更加适当的意图类别信心分数。该技术可采用相应的软件、硬件以及软硬结合的方式实现。以下对本申请实
施例进行详细介绍。
[0027]请参阅图1,本申请实施例提供一种应用于电子设备的意图识别方法,该方法包括:
[0028]步骤S101:使用预设模型对同一句子预测M次。
[0029]在本申请实施例中,电子设备可以是机器人,用户与机器人的对话过程中,用户会向机器人输入大量的句子,句子中有长句子和短句子。当机器人收到用户输入的句子后,会识别句子中所包含的用户的意图,并根据这些意图及其信心值触发后续的机器人服务。当机器人收到用户的句子后,首先会确定句子的长度,当句子长度小于N时,此时表明收到句子是短句,机器人使用预设模型对收到的句子预测一次。当句子长度大于N时,此时表明收到的句子是长句子,机器人使用预设模型对收到的句子预测M次。通过多次预测同一个长句子,可以尽可能的将句本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:使用预设模型对同一句子预测M次;将每次预测获得的意图类别信心值P
i
和无意图类别的信心值TH比较,保留P
i
>TH的意图类别;将所述保留的意图类别信心值进行调分,获得信心分数。2.根据权利要求1所述的方法,其特征在于,所述使用预设模型对同一句子预测M次之前,包括:将用户输入的语料和无意图语料一同训练,获得所述预设模型;其中,所述无意图语料为在用户人机对话的历史日志中随机抽取的无意图的句子;所述预设模型的输出为意图类别和无意图类别的出现机率分布,所述P
i
为意图类别的出现机率,所述TH为无意图类别的出现机率。3.根据权利要求1或2所述的方法,其特征在于,所述预设模型每次预测获得的P
i
与TH之和为1。4.根据权利要求1所述的方法,其特征在于,所述使用预设模型对同一句子预测M次,包括:抽取所述句子中长度为N的子字串,共抽取M次;使用所述预设模型分别对所述子字串进行预测。5.根据权利要求4所述的方法,其特征在于,所述抽取所述句子中长度为N的子字串,共抽取M次,包括:抽取所述句子中第一个字到第N个字作为第一子字串;位移W个字,抽取所述句子中第W个字到第N+W个字作为第二子字串,重复该步骤直至子字串的长度小于等于N,该子字串为第M子字串。6.根据权利要求1中所述的方法,其特...

【专利技术属性】
技术研发人员:简仁贤李佳纯佘昌宪
申请(专利权)人:竹间智能科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1