词槽识别方法及装置、计算机可读存储介质、电子设备制造方法及图纸

技术编号:25521784 阅读:32 留言:0更新日期:2020-09-04 17:12
本发明专利技术实施例是关于一种词槽识别方法及装置、计算机可读存储介质、电子设备,该方法包括:对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。本发明专利技术实施例提高了词槽识别结果的准确率。

【技术实现步骤摘要】
词槽识别方法及装置、计算机可读存储介质、电子设备
本专利技术实施例涉及机器学习
,具体而言,涉及一种词槽识别方法、词槽识别装置、计算机可读存储介质以及电子设备。
技术介绍
多轮对话是目前NLP(NaturalLanguageProcessing,自然语言处理)领域的一个重要应用场景。多轮对话指的是机器人与人之间进行的多回合对话。为了实现多回合的对话,需要建立多轮对话机器人,每个机器人下面建立不同的意图,而意图下面设置必填词槽,当必填词槽未被识别到时,需要通过反问澄清方式反问用户,用户做出回答后进入下一个必填槽位的澄清环节,当所有必填槽位都被澄清后,多轮对话给出最终答案。因此,多轮对话是基于满足特定的意图下的所触发的一系列反问澄清和答案生成的过程。具体的,在机器人输出反问引导话术到用户后,用户回答以进行反问澄清,此时用户回答的语句通常为短语句。其中,短语句是指具有意图模糊,句子成分不全,词槽数不多的句子。短语句的意图模糊性和缺乏足够的槽位标注,导致训练模型无法收敛。因此,普通的词槽识别方式将无法识别短语句的词槽。在现有的短语句词槽识别方法中,可以包括如下两种方式。一种是,同义词匹配:通过配置待澄清词槽和他的同义词,并采用同义词匹配的方式捕获词槽。另一种是实体识别:通过各种不同的实体识别的算法,识别出句子中的词槽,比较常用的实体识别算法是基于incoder-decoder的seq2seq算法。但是上述方式存在如下缺陷:在第一种方式中,通过配置待澄清词槽的所有可能出现的主词及其同义词副词,在反问澄清时进行完全匹配,识别词槽,该枚举方案不能完全穷尽词槽的所有可能值,当澄清对话中含有其他字词时,无法从同义词库中找到完全匹配项,从而导致词槽识别结果的准确率较低。在第二种方式中,利用事先标注好的词槽和句子作为训练数据训练出识别模型,通过模型识别出句中的待澄清词槽。在反问澄清环节,系统已获取到意图。因此,训练每个意图的词槽识别模型,这样每条澄清语句进入到该意图下的模型,进行澄清词槽的识别。但是,该方案需要训练每个意图下的模型,因此词槽识别过程较为繁琐且识别速度较慢。因此,需要提供一种新的词槽识别方法。需要说明的是,在上述
技术介绍
部分专利技术的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术的目的在于提供一种词槽识别方法、词槽识别装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的识别结果的准确率较低以及识别过程较为繁琐且识别速度较慢的问题。根据本公开的一个方面,提供一种词槽识别方法,包括:对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。在本公开的一种示例性实施例中,所述词槽识别方法还包括:利用历史反问语句对双向LSTM模型进行训练,得到词槽识别模型;其中,根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果包括:将各所述待识别拼接向量输入至词槽识别模型中,得到所述待识别短语句的特征词槽识别结果以及关键词槽识别结果。在本公开的一种示例性实施例中,利用历史反问语句对双向LSTM模型进行训练,得到所述词槽识别模型包括:根据历史反问语句得到标准短语句以及标准句子意图,并对所述标准短语句以及所述标准句子意图进行向量化得到标准短语句向量以及标准意图向量;对所述标准短语句向量以及所述标准意图向量进行拼接得到标准输入向量,并根据所述标准输入向量得到初始关键词槽以及初始特征词槽;根据所述初始关键词槽以及目标关键词槽得到关键词槽损失函数,并根据初始特征词槽与目标特征词槽得到特征词槽损失函数;根据所述关键词槽损失函数以及所述特征词槽损失函数得到交叉熵损失函数,并利用所述交叉熵损失函数对双向LSTM模型进行迭代训练,得到所述词槽识别模型。在本公开的一种示例性实施例中,根据所述标准输入向量得到初始关键词槽以及初始特征词槽包括:将所述标准输入向量输入至编解码框架中的编码双向LSTM模型中,得到标准词槽向量以及标准编码向量;根据所述标准编码向量得到标准意图向量,并根据所述标准词槽向量计算词槽注意力权重,以及根据所述标准意图向量计算意图注意力权重;根据所述词槽注意力权重计算词槽上下文值,并根据所述意图注意力权重计算意图上下文值;将所述标准编码向量、词槽上下文值以及意图上下文值输入至编解码框架中的解码双向LSTM模型中得到所述初始关键词槽以及初始特征词槽。在本公开的一种示例性实施例中,根据所述标准词槽向量计算词槽注意力权重包括:利用归一化指数函数对所述标准词槽向量进行计算,得到所述词槽注意力权重。在本公开的一种示例性实施例中,根据所述词槽注意力权重计算词槽上下文值包括:对所述词槽注意力权重进行加权求和,得到所述词槽上下文值。在本公开的一种示例性实施例中,在得到所述词槽识别模型之后,所述词槽识别方法还包括:利用所述词槽识别模型对待识别语句进行标注得到初始标注样本,并对所述初始标注样本进行校正得到标准样本;根据所述初始标注样本以及标准样本构建训练数据集以及测试数据集,并利用所述测试数据集对所述词槽识别模型进行测试;在确定测试结果的准确率未达到预设阈值时,利用所述训练数据集对所述词槽识别模型进行再次训练。根据本公开的一个方面,提供一种词槽识别装置,包括:分词模块,用于对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;第一处理模块,用于对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;第二处理模块,用于对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;词槽识别模块,用于根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的词槽识别方法。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行本文档来自技高网
...

【技术保护点】
1.一种词槽识别方法,其特征在于,包括:/n对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;/n对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;/n对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;/n根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。/n

【技术特征摘要】
1.一种词槽识别方法,其特征在于,包括:
对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;
对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;
对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;
根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。


2.根据权利要求1所述的词槽识别方法,其特征在于,所述词槽识别方法还包括:
利用历史反问语句对双向LSTM模型进行训练,得到词槽识别模型;
其中,根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果包括:
将各所述待识别拼接向量输入至词槽识别模型中,得到所述待识别短语句的特征词槽识别结果以及关键词槽识别结果。


3.根据权利要求2所述的词槽识别方法,其特征在于,利用历史反问语句对双向LSTM模型进行训练,得到所述词槽识别模型包括:
根据历史反问语句得到标准短语句以及标准句子意图,并对所述标准短语句以及所述标准句子意图进行向量化得到标准短语句向量以及标准意图向量;
对所述标准短语句向量以及所述标准意图向量进行拼接得到标准输入向量,并根据所述标准输入向量得到初始关键词槽以及初始特征词槽;
根据所述初始关键词槽以及目标关键词槽得到关键词槽损失函数,并根据初始特征词槽与目标特征词槽得到特征词槽损失函数;
根据所述关键词槽损失函数以及所述特征词槽损失函数得到交叉熵损失函数,并利用所述交叉熵损失函数对双向LSTM模型进行迭代训练,得到所述词槽识别模型。


4.根据权利要求3所述的词槽识别方法,其特征在于,根据所述标准输入向量得到初始关键词槽以及初始特征词槽包括:
将所述标准输入向量输入至编解码框架中的编码双向LSTM模型中,得到标准词槽向量以及标准编码向量;
根据所述标准编码向量得到标准意图向量,并根据所述标准词槽向量计算词槽注意力权重,以及根据所述标准意图向量计算意图注意力权重;
根据所述词槽注意力权重计算词槽上下文值...

【专利技术属性】
技术研发人员:杜维刘设伟
申请(专利权)人:泰康保险集团股份有限公司泰康在线财产保险股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1