一种基于语句补全的多轮对话领域识别方法和装置制造方法及图纸

技术编号:33041407 阅读:11 留言:0更新日期:2022-04-15 09:22
本发明专利技术公开了一种基于语句补全的多轮对话领域识别方法及装置,方法包括:将历史对话语料和每个领域转换为语义向量;按顺序考虑第N个领域,将该领域的语义向量和历史语料的语义向量输入到语句补全模型,得到补全后的句子;将第N个领域补全后的句子输入到有效性判定模型,若判定为有效,第N个领域即为识别结果,否则跳转回步骤二,继续考虑第N+1个领域。本发明专利技术将多轮对话领域识别任务和语句补全任务结合起来,可以很好地识别用户在多轮对话中回复省略句的情况。此外本发明专利技术既利用了对话的历史信息,又保证了历史信息不会对领域切换造成干扰,从而提高识别的准确性。从而提高识别的准确性。从而提高识别的准确性。

【技术实现步骤摘要】
一种基于语句补全的多轮对话领域识别方法和装置


[0001]本专利技术涉及自然语言处理和深度学习
,尤其涉及一种基于语句补全的多轮对话领域识别方法和装置。

技术介绍

[0002]从人工智能研究的初期开始,人们就致力于开发高度智能化的人机对话系统。艾伦
·
图灵(Alan Turing)在1950年提出图灵测试,认为如果人类无法区分和他对话交谈的是机器还是人类,那么就可以说机器通过了图灵测试,拥有高度的智能。随着信息技术和自然语言处理技术的不断发展,人机对话系统初步地应用在智能客服、智能音箱等场景,人们的期望也逐渐从单领域单轮的对话系统变为多领域多轮的对话系统。
[0003]在多领域多轮的对话系统中,第一步就是领域识别。聊天计算机获取用户的输入,将其正确地分类到相应的领域,然后再基于该领域开展后续任务。所以领域识别的准确性直接决定了整个对话系统的服务质量。
[0004]一种思路是只基于当前轮语句来识别领域。较早的方法利用领域的先验知识或模板来识别,后来有了基于统计方法的分类模型。随着深度学习技术的发展,还出现了卷积神经网络、循环神经网络、fastText等分类模型。然而这些方法没有利用历史信息,无法处理用户回复省略句的情况。
[0005]另外一种思路是将历史语句和当前轮语句的特征融合在一起作为输入,训练分类模型。然而当历史语句和当前轮语句的领域不一致时,历史语句完全变成了干扰信息,很大地影响了分类的准确性。这种情况下,可能需要用户反复强调才能成功切换领域,很影响用户体验。r/>[0006]综上所述,现有领域识别模型存在以下几点问题:
[0007](1)、基于单轮的领域识别模型只利用了当前轮信息,没有利用历史信息,模型的灵活性不高,无法处理实际对话中用户经常回复省略句的情况。
[0008](2)、一些利用了历史信息的领域识别模型,只是单纯地将历史信息和当前轮信息合在一起,没有考虑到在领域切换时历史信息含有干扰信息,模型的准确率较低。

技术实现思路

[0009]本专利技术提供了一种基于语句补全的多轮对话领域识别方法和装置,以解决上述技术问题。
[0010]本专利技术采用的技术方案是:提供一种基于语句补全的多轮对话领域识别方法,包括:
[0011]步骤一,将历史对话语料和每个领域转换为语义向量;
[0012]步骤二,按顺序考虑第N个领域,将该领域的语义向量和历史语料的语义向量输入到语句补全模型,得到补全后的句子;
[0013]步骤三,将第N个领域补全后的句子输入到有效性判定模型,若判定为有效,第N个
领域即为识别结果,否则跳转回步骤二,继续考虑第N+1个领域。
[0014]进一步的,获取语义向量的方法包括:基于深度学习的语义编码方法。
[0015]进一步的,步骤二中,按顺序考虑领域的方法包括,对于非首轮语句,将上一轮语句的领域作为首要考虑领域。
[0016]进一步的,构建语句补全模型的方法包括:Seq2Seq模型或Pointer

Generator Networks模型。
[0017]进一步的,构建所述语句补全模型后,还包括设定损失函数,以及设定迭代更新所述语句补全模型的参数。
[0018]进一步的,语句补全模型的训练方法包含:获取语料数据,根据实际需求对语料中的文本进行处理,将处理后的文本转换为语义向量,将所述语义向量输入语句补全模型进行训练,得到训练好的语句补全模型。
[0019]进一步的,构建有效性判定模型的方法包括:基于深度学习的分类模型方法。
[0020]进一步的,构建所述有效性判定模型后,还包括设定损失函数,以及设定迭代更新所述有效性判定模型的参数。
[0021]进一步的,有效性判定模型的训练方法包含:获取语料数据,根据实际需求对语料中的文本进行处理,将处理后的文本转换为语义向量,将所述语义向量输入有效性判定模型进行训练,得到训练好的有效性判定模型。
[0022]本专利技术还提供一种基于语句补全的多轮对话领域识别装置,包括:
[0023]语义编码单元,用于将历史对话语料和每个领域转换为语义向量;
[0024]语句补全单元,用于将第N个领域的语义向量和历史语料的语义向量输入到语句补全模型,得到补全后的句子;
[0025]有效性判定单元,用于将第N个领域补全后的句子输入到有效性判定模型,若判定为有效,第N个领域即为识别结果,否则跳转回语句补全单元,继续考虑第N+1个领域。
[0026]本专利技术的有益效果是:
[0027](1)本专利技术将多轮对话领域识别任务和语句补全任务结合起来,可以很好地识别用户在多轮对话中回复省略句的情况。
[0028](2)本专利技术既利用了对话的历史信息,又保证了历史信息不会对领域切换造成干扰,从而提高识别的准确性。
[0029](3)本专利技术可以得到补全后的语句,方便多轮对话的后续任务。
附图说明
[0030]图1为本专利技术一种基于语句补全的多轮对话领域识别方法的流程示意图。
[0031]图2为本专利技术一种基于语句补全的多轮对话领域识别装置的构图框图。
具体实施方式
[0032]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步详细描述,但本专利技术的实施方式不限于此。
[0033]实施例1:
[0034]如图1所示,是本专利技术一种基于语句补全的多轮对话领域识别方法的实施例一中
的流程示意图,包括:
[0035]步骤1、将历史对话语料和每个领域转换为语义向量。
[0036]具体实施例中,获得语义向量的方法,包括:基于深度学习的语义编码方法,如RNN模型,LSTM模型,BERT模型等。
[0037]步骤2、按顺序考虑第N个领域,将该领域的语义向量和历史语料的语义向量输入到语句补全模型,得到补全后的句子。
[0038]具体实施例中,按顺序考虑领域的方法,包括:对于非首轮语句,优先考虑上一轮语句的领域。
[0039]具体实施例中,将所述语义向量输入语句补全模型之前,还包括构建语句补全模型的方法。
[0040]所述构建语句补全模型的方法,包括:采用Seq2Seq模型,包含Encoder、Decoder以及连接两者的中间状态向量C,Encoder将输入序列通过学习编码成一个固定大小的状态向量C,继而将C传递给Decoder,Decoder再通过对状态向量C的学习输出对应的序列。
[0041]所述构建语句补全模型的方法,还包括:采用Pointer

generator网络,在Seq2Seq模型的基础上加入注意力机制,使用Encoder阶段上一个时刻的隐藏状态来计算attention,得到上下文向量,再将其作为该时刻单元的输入。
[0042]具体实施例中,所述语句补全模型采用交叉熵损失函数来计算真实值与预测值之间的差值。
[0043]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于语句补全的多轮对话领域识别方法,其特征在于,包括:步骤一,将历史对话语料和每个领域转换为语义向量;步骤二,按顺序考虑第N个领域,将该领域的语义向量和历史语料的语义向量输入到语句补全模型,得到补全后的句子;步骤三,将第N个领域补全后的句子输入到有效性判定模型,若判定为有效,第N个领域即为识别结果,否则跳转回步骤二,继续考虑第N+1个领域。2.根据权利要求1所述的基于语句补全的多轮对话领域识别方法,其特征在于,获取语义向量的方法包括:基于深度学习的语义编码方法。3.根据权利要求1所述的基于语句补全的多轮对话领域识别方法,其特征在于,步骤二中,按顺序考虑领域的方法包括,对于非首轮语句,将上一轮语句的领域作为首要考虑领域。4.根据权利要求1所述的基于语句补全的多轮对话领域识别方法,其特征在于,构建语句补全模型的方法包括:Seq2Seq模型或Pointer

Generator Networks模型。5.根据权利要求1所述的基于语句补全的多轮对话领域识别方法,其特征在于,构建所述语句补全模型后,还包括设定损失函数,以及设定迭代更新所述语句补全模型的参数。6.根据权利要求1所述的基于语句补全的多轮对话领域识别方法,其特征在于,语句补全模型的训...

【专利技术属性】
技术研发人员:李焕谭斌杨兰饶璐周兴发孙锐展华益
申请(专利权)人:四川启睿克科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1