对话意图的分类方法、装置、设备及存储介质制造方法及图纸

技术编号:31628269 阅读:17 留言:0更新日期:2021-12-29 19:06
本申请涉及人工智能技术领域,揭示了一种对话意图的分类方法、装置、设备及存储介质,其中方法包括:获取目标对话的查询语句和内容语句;通过第一双向长短期记忆编码器对查询语句进行编码,并通过预设的分类算法对编码后的查询语句进行分类,得到对应的第一分类结果;通过第一分类结果对第二双向长短期记忆编码器进行更新,并通过更新后的第二双向长短期记忆编码器对内容语句进行编码;将第一分类结果和编码后的内容语句作为分类算法的输入参数,得到第二分类结果;通过第二分类结果对第一双向长短期记忆编码器进行更新,从而得到更新后的第一双向长短期记忆编码器对应的新的第一分类结果;进行多次迭代计算,将最后的第一分类结果作为查询语句的意图分类结果;从而提高了对查询语句进行意图分类的准确率。对查询语句进行意图分类的准确率。对查询语句进行意图分类的准确率。

【技术实现步骤摘要】
对话意图的分类方法、装置、设备及存储介质


[0001]本申请涉及到人工智能
,特别是涉及到一种对话意图的分类方法、装置、设备及存储介质。

技术介绍

[0002]随着智能语音技术的发展,智能语音问答系统能够帮助用户在有限轮次中完成具有明确意图的任务,因此,智能语音问答需要能够准确地识别用户意图。
[0003]现有技术中的用户意图识别,通常将用户的查询问题作为目标进行聚类。但实际场景中,由于查询语句通常较短,对简单的查询语句进行意图聚类,会导致意图分类准确率较低。

技术实现思路

[0004]本申请的主要目的为提供一种对话意图的分类方法、装置、设备及存储介质,旨在解决现有技术中对查询语句进行意图分类的准确率较低的技术问题。
[0005]为了实现上述专利技术目的,本申请提出一种对话意图的分类方法,所述方法包括:
[0006]获取目标对话,对所述目标对话进行分类,得到查询语句和内容语句;
[0007]通过第一双向长短期记忆编码器对所述查询语句进行编码,并通过预设的分类算法对编码后的所述查询语句进行分类,得到对应的第一分类结果;
[0008]通过第一分类结果和所述内容语句对第二双向长短期记忆编码器进行更新,并通过更新后的所述第二双向长短期记忆编码器对所述内容语句进行编码;
[0009]将所述第一分类结果和编码后的所述内容语句作为所述分类算法的输入,得到第二分类结果;
[0010]采用第二分类结果和所述查询语句对所述第一双向长短期记忆编码器进行更新,并通过更新后的所述第一双向长短期记忆编码器对所述查询语句进行编码,将编码后的所述查询数据输入所述分类算法,并将所述分类算法的输出作为新的所述第一分类结果;
[0011]采用所述第一分类结果和所述第二分类结果,以及所述查询语句和所述内容语句对所述第一双向长短期记忆编码器和所述第二双向长短期记忆编码器进行迭代更新,直至满足预设的迭代停止条件,并将迭代停止时的所述第一分类结果作为所述查询语句的意图分类结果。
[0012]进一步的,所述通过第一分类结果和所述内容语句对所述第二双向长短期记忆编码器进行更新,包括:
[0013]在所述查询语句包含的k个意图集群中,分别选取至少一个子集作为支撑集,根据下式计算每个所述支撑集的原型参数:
[0014][0015]式中,c
k
为所述原型参数,S
k
为所述查询语句的数据集,为所述内容语句,为所述第一分类结果,f
φ2
为第二双向长短期记忆编码器的算法约束,i为所述第二双向长短期记忆编码器的迭代次数;
[0016]将所述查询对话中,除支撑集以外的部分作为查询数据点集合,对于任意一个所述查询数据点集合中的查询数据点,通过下式计算所述查询数据点对于所述支撑集的类分布概率:
[0017][0018]式中,p为类分布概率,x为所述查询数据点,d(f
φ2
(x),c
k
)为所述原型参数与所述查询数据点之间的距离;
[0019]对第二双向长短期记忆编码器的参数进行更新,以使所述类分布概率满足的负对数似然最小化条件。
[0020]进一步的,所述通过所述第一双向长短期记忆编码器对所述查询语句进行编码之前,还包括:
[0021]获取训练数据集,其中,所述训练数据集中包括若干个序列化的训练数据;
[0022]若所述训练数据的数量大于预设的数据阈值,获取所述训练数据的随机数序列,通过所述随机数序列对分层双向长短期记忆网络中的第一双向长短期记忆编码器和第二双向长短期记忆编码器进行初始化训练;
[0023]若所述训练数据的数量不大于预设的数据阈值,通过从语料库获取若干个语句段落对预设的原始查询编码器进行预训练,得到所述第一双向长短期记忆编码器,并通过所述语句段落对应的上下文语句对预设的原始内容编码器进行预训练,得到所述第二双向长短期记忆编码器。
[0024]进一步的,所述所述通过从语料库获取若干个语句段落对预设的原始查询编码器进行预训练,得到所述第一双向长短期记忆编码器,并通过所述语句段落对应的上下文语句对预设的原始内容编码器进行预训练,得到所述第二双向长短期记忆编码器,包括:
[0025]通过所述原始查询编码器对所述语句段落进行编码,并计算所述语句段落的第一语句向量;
[0026]通过所述原始内容编码器获取所述上下文语句,对所述上下文语句进行编码,并计算所述上下文语句的第二语句向量;
[0027]计算所述第一语句向量与第二语句向量的内积,对所述原始查询编码器和所述原始内容编码器进行机器学习,直至所述内积的对数似然满足最大化条件,并将学习后的所述原始查询编码器和所述原始内容编码器分别作为所述第一双向长短期记忆编码器和所述第二双向长短期记忆编码器。
[0028]进一步的,所述对所述目标对话进行分类,包括:
[0029]通过语法树对所述目标对话进行语义解析,得到所述目标对话的流程视图;
[0030]根据所述流程视图对所述目标对话进行分类。
[0031]进一步的,所述通过预设的分类算法对编码后的所述查询语句进行分类,包括:
[0032]通过k

means聚类算法对编码后的所述查询语句进行分类。
[0033]进一步的,得到所述意图分类结果之后,还包括:
[0034]根据所述意图分类结果,将同一个意图类别下的所述查询语句排列在同一个查询列表中。
[0035]本申请还提出了一种对话意图的分类装置,包括:
[0036]对话分类模块,用于获取目标对话,对所述目标对话进行分类,得到查询语句和内容语句;
[0037]第一分类模块,用于通过第一双向长短期记忆编码器对所述查询语句进行编码,并通过预设的分类算法对编码后的所述查询语句进行分类,得到对应的第一分类结果;
[0038]第一编码器更新模块,用于通过第一分类结果和所述内容语句对第二双向长短期记忆编码器进行更新,并通过更新后的所述第二双向长短期记忆编码器对所述内容语句进行编码;
[0039]第二分类模块,用于将所述第一分类结果和编码后的所述内容语句作为所述分类算法的输入,得到第二分类结果;
[0040]第二编码器更新模块,用于采用第二分类结果和所述查询语句对所述第一双向长短期记忆编码器进行更新,并通过更新后的所述第一双向长短期记忆编码器对所述查询语句进行编码,将编码后的所述查询数据输入所述分类算法,并将所述分类算法的输出作为新的所述第一分类结果;
[0041]迭代分类模块,用于采用所述第一分类结果和所述第二分类结果,以及所述查询语句和所述内容语句对所述第一双向长短期记忆编码器和所述第二双向长短期记忆编码器进行迭代更新,直至满足预设的迭代停止条件,并将迭代停止时的所述第一分类结果作为所述查询语句的意图分类结果。
[0042]本申请还提出了一种计算机设备,包括存储器和处理器,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话意图的分类方法,其特征在于,所述方法包括:获取目标对话,对所述目标对话进行分类,得到查询语句和内容语句;通过第一双向长短期记忆编码器对所述查询语句进行编码,并通过预设的分类算法对编码后的所述查询语句进行分类,得到对应的第一分类结果;通过第一分类结果和所述内容语句对第二双向长短期记忆编码器进行更新,并通过更新后的所述第二双向长短期记忆编码器对所述内容语句进行编码;将所述第一分类结果和编码后的所述内容语句作为所述分类算法的输入,得到第二分类结果;采用第二分类结果和所述查询语句对所述第一双向长短期记忆编码器进行更新,并通过更新后的所述第一双向长短期记忆编码器对所述查询语句进行编码,将编码后的所述查询数据输入所述分类算法,并将所述分类算法的输出作为新的所述第一分类结果;采用所述第一分类结果和所述第二分类结果,以及所述查询语句和所述内容语句对所述第一双向长短期记忆编码器和所述第二双向长短期记忆编码器进行迭代更新,直至满足预设的迭代停止条件,并将迭代停止时的所述第一分类结果作为所述查询语句的意图分类结果。2.根据权利要求1所述的对话意图的分类方法,其特征在于,所述通过第一分类结果和所述内容语句对所述第二双向长短期记忆编码器进行更新,包括:在所述查询语句包含的k个意图集群中,分别选取至少一个子集作为支撑集,根据下式计算每个所述支撑集的原型参数:式中,c
k
为所述原型参数,S
k
为所述查询语句的数据集,为所述内容语句,为所述第一分类结果,f
φ2
为第二双向长短期记忆编码器的算法约束,i为所述第二双向长短期记忆编码器的迭代次数;将所述查询对话中,除支撑集以外的部分作为查询数据点集合,对于任意一个所述查询数据点集合中的查询数据点,通过下式计算所述查询数据点对于所述支撑集的类分布概率:式中,p为类分布概率,x为所述查询数据点,d(f
φ2
(x),c
k
)为所述原型参数与所述查询数据点之间的距离;对第二双向长短期记忆编码器的参数进行更新,以使所述类分布概率满足的负对数似然最小化条件。3.根据权利要求1所述的对话意图的分类方法,其特征在于,所述通过所述第一双向长短期记忆编码器对所述查询语句进行编码之前,还包括:获取训练数据集,其中,所述训练数据集中包括若干个序列化的训练数据;若所述训练数据的数量大于预设的数据阈值,获取所述训练数据的随机数序列,通过所述随机数序列对分层双向长短期记忆网络中的第一双向长短期记忆编码器和第二双向
长短期记忆编码器进行初始化训练;若所述训练数据的数量不大于预设的数据阈值,通过从语料库获取若干个语句段落对预设的原始查询编码器进行预训练,得到所述第一双向长短期记忆编码器,并通过所述语句段落对应的上下文语句对预设的原始内容编码器进行预训练,得到所述第二双向长短期记忆编码器。4.根据权利要求3所述的对话意图的分类方法,其特征在于,所述通过从语料库获取...

【专利技术属性】
技术研发人员:倪子凡王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1