【技术实现步骤摘要】
词槽识别方法及装置、计算机可读存储介质、电子设备
本专利技术实施例涉及机器学习
,具体而言,涉及一种词槽识别方法、词槽识别装置、计算机可读存储介质以及电子设备。
技术介绍
多轮对话是目前NLP(NaturalLanguageProcessing,自然语言处理)领域的一个重要应用场景。多轮对话指的是机器人与人之间进行的多回合对话。为了实现多回合的对话,需要建立多轮对话机器人,每个机器人下面建立不同的意图,而意图下面设置必填词槽,当必填词槽未被识别到时,需要通过反问澄清方式反问用户,用户做出回答后进入下一个必填槽位的澄清环节,当所有必填槽位都被澄清后,多轮对话给出最终答案。因此,多轮对话是基于满足特定的意图下的所触发的一系列反问澄清和答案生成的过程。具体的,在机器人输出反问引导话术到用户后,用户回答以进行反问澄清,此时用户回答的语句通常为短语句。其中,短语句是指具有意图模糊,句子成分不全,词槽数不多的句子。短语句的意图模糊性和缺乏足够的槽位标注,导致训练模型无法收敛。因此,普通的词槽识别方式将无法识别短语句的词槽。在现有的短语句词槽识别方法中,可以包括如下两种方式。一种是,同义词匹配:通过配置待澄清词槽和他的同义词,并采用同义词匹配的方式捕获词槽。另一种是实体识别:通过各种不同的实体识别的算法,识别出句子中的词槽,比较常用的实体识别算法是基于incoder-decoder的seq2seq算法。但是上述方式存在如下缺陷:在第一种方式中,通过配置待澄清词槽的所有可能出现的主词及其同义词副词,在反问澄清时 ...
【技术保护点】
1.一种词槽识别方法,其特征在于,包括:/n对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;/n对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;/n对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;/n根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。/n
【技术特征摘要】
1.一种词槽识别方法,其特征在于,包括:
对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;
对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;
对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;
根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。
2.根据权利要求1所述的词槽识别方法,其特征在于,所述词槽识别方法还包括:
利用历史反问语句对双向LSTM模型进行训练,得到词槽识别模型;
其中,根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果包括:
将各所述待识别拼接向量输入至词槽识别模型中,得到所述待识别短语句的特征词槽识别结果以及关键词槽识别结果。
3.根据权利要求2所述的词槽识别方法,其特征在于,利用历史反问语句对双向LSTM模型进行训练,得到所述词槽识别模型包括:
根据历史反问语句得到标准短语句以及标准句子意图,并对所述标准短语句以及所述标准句子意图进行向量化得到标准短语句向量以及标准意图向量;
对所述标准短语句向量以及所述标准意图向量进行拼接得到标准输入向量,并根据所述标准输入向量得到初始关键词槽以及初始特征词槽;
根据所述初始关键词槽以及目标关键词槽得到关键词槽损失函数,并根据初始特征词槽与目标特征词槽得到特征词槽损失函数;
根据所述关键词槽损失函数以及所述特征词槽损失函数得到交叉熵损失函数,并利用所述交叉熵损失函数对双向LSTM模型进行迭代训练,得到所述词槽识别模型。
4.根据权利要求3所述的词槽识别方法,其特征在于,根据所述标准输入向量得到初始关键词槽以及初始特征词槽包括:
将所述标准输入向量输入至编解码框架中的编码双向LSTM模型中,得到标准词槽向量以及标准编码向量;
根据所述标准编码向量得到标准意图向量,并根据所述标准词槽向量计算词槽注意力权重,以及根据所述标准意图向量计算意图注意力权重;
根据所述词槽注意力权重计算词槽上下文值...
【专利技术属性】
技术研发人员:杜维,刘设伟,
申请(专利权)人:泰康保险集团股份有限公司,泰康在线财产保险股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。