一种对话系统的语句智能澄清方法及系统技术方案

技术编号:24290007 阅读:40 留言:0更新日期:2020-05-26 20:12
本发明专利技术公开了一种对话系统的语句智能澄清方法及系统,包括:对获取的用户句子序列进行分词处理,以获取所述用户句子序列中的多个单词;将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子;当所述用户句子序列为歧义句子时,以中文的结束标点符号为切分依据,对所述用户句子序列进行分句处理,以获取切分子句;计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度,根据所述相似度确定切分子句的意图。本发明专利技术得到方法能够识别歧义句子,对歧义句子进行多意图的分类,给出对应的澄清话术,帮助用户尽快完成相关任务需求,提升了用户体验。

An intelligent statement clarification method and system for dialogue system

【技术实现步骤摘要】
一种对话系统的语句智能澄清方法及系统
本专利技术涉及智能语义分析
,并且更具体地,涉及一种对话系统的语句智能澄清方法及系统。
技术介绍
对话系统的主要目标是实现人和机器的无障碍交流,可以用于闲聊,订餐馆,订票等任何机器可以代替人做的任务。然而,多数情况下用户的话带有歧义性,通过对对话数据的分析总结,可分为两种:(1)用户说的话包含多种意图,如图1左;(2)用户在表达一种意图之前,做了较长的铺垫(说了较多无用的话),如图1右。目前已有的对话机器人,对于用户带有歧义的话,一般采用拒识,或者给予不准确的回复,让用户觉得机器人不能理解自己的话,大大降低了用户的对话体验感。在话系统中,依据机器人的理解力,可将用户的回答分为三种:(1)机器理解用户说的话,对话继续;(2)机器完全不理解用户说的话,采用兜底话术,比如“抱歉,我没听明白”;(3)机器部分理解,但用户的话带有歧义性,需进一步澄清,给出推荐选项。针对后两种情况,是目前对话系统技术急需要解决的难题。因此,需要一种对话系统的语句智能澄清方法及系统,以解决如何快速准确地识别歧义句子,并理解及澄清的问题。
技术实现思路
本专利技术提出一种对话系统的语句智能澄清方法及系统,以解决如何快速准确地识别歧义句子,并理解及澄清的问题。为了解决上述问题,根据本专利技术的一个方面,提供了一种对话系统的语句智能澄清方法,所述方法包括:对获取的用户句子序列进行分词处理,以获取所述用户句子序列中的多个单词;将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子;当所述用户句子序列为歧义句子时,以中文的结束标点符号为切分依据,对所述用户句子序列进行分句处理,以获取切分子句;计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度,根据所述相似度确定切分子句的意图。优选地,其中所述将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子,包括:利用SeqGAN模型获取用户句子序列中每个单词的embedding特征,并经过隐含层函数的映射,得到隐含层状态序列;所述隐含层状态序列经过softmax层处理,输出每个单词的概率分布;根据每个单词的概率分布和预设的歧义句子语料库中的数据,采用卷积神经网络进行匹配,以确定所述用户句子序列是否为歧义句子。优选地,其中所述SeqGAN模型,包括:一个生成器G和一个判别器D,利用如下方式确定所述SeqGAN模型,包括:收集对话数据中,将用户带歧义的句子语料作为模型的训练集{s1,s2,...,sn},其中每个si为句子序列,表示si={x1:T},xj表示句子中的单个词;使用训练集对G进行预训练,以最大似然估计作为优化目标;使用预训练的G生成多个负样本,结合真实的歧义句子对D进行预训练,D训练以交叉熵作为优化目标;G和D相互博弈进行优化,直至SeqGAN达到收敛,确定所述SeqGAN模型。优选地,其中所述方法还包括:基于BERT训练模型确定预设的意图语料库中每个意图类别的加权平均向量,包括:其中,为多个文本的加权平均向量;表示第i类意图的第j个用户表达,BERT为文本对应的相量;i∈{1,2,...m},j∈{1,2,...n}。优选地,其中所述根据所述相似度确定切分子句的意图,包括:其中,BERT(xp)为切分子句xp使用BERT预训练模型获得对应的向量;thre为预设的相似度阈值;当切分子句的向量与某个意图类别的加权平均向量的相似度大于所述相似度阈值时,确定最大的相似度对应的意图类别,即为所述切分子句对应的要表达的意图。根据本专利技术的另一个方面,提供了一种对话系统的语句智能澄清系统,所述系统包括:分词单元,用于对获取的用户句子序列进行分词处理,以获取所述用户句子序列中的多个单词;歧义句子确定单元,用于将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子;切分子句获取单元,用于当所述用户句子序列为歧义句子时,以中文的结束标点符号为切分依据,对所述用户句子序列进行分句处理,以获取切分子句;意图确定单元,用于计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度,根据所述相似度确定切分子句的意图。优选地,其中所述歧义句子确定单元,将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子,包括:利用SeqGAN模型获取用户句子序列中每个单词的embedding特征,并经过隐含层函数的映射,得到隐含层状态序列;所述隐含层状态序列经过softmax层处理,输出每个单词的概率分布;根据每个单词的概率分布和预设的歧义句子语料库中的数据,采用卷积神经网络进行匹配,以确定所述用户句子序列是否为歧义句子。优选地,其中所述SeqGAN模型,包括:一个生成器G和一个判别器D,利用如下方式确定所述SeqGAN模型,包括:收集对话数据中,将用户带歧义的句子语料作为模型的训练集{s1,s2,...,sn},其中每个si为句子序列,表示si={x1:T},xj表示句子中的单个词;使用训练集对G进行预训练,以最大似然估计作为优化目标;使用预训练的G生成多个负样本,结合真实的歧义句子对D进行预训练,D训练以交叉熵作为优化目标;G和D相互博弈进行优化,直至SeqGAN达到收敛,确定所述SeqGAN模型。优选地,其中所述系统还包括:加权平均向量确定单元,用于基于BERT训练模型确定预设的意图语料库中每个意图类别的加权平均向量,包括:其中,为多个文本的加权平均向量;表示第i类意图的第j个用户表达,BERT为文本对应的相量;i∈{1,2,...m},j∈{1,2,...n}。优选地,其中所述意图确定单元,根据所述相似度确定切分子句的意图,包括:其中,BERT(xp)为切分子句xp使用BERT预训练模型获得对应的向量;thre为预设的相似度阈值;当切分子句的向量与某个意图类别的加权平均向量的相似度大于所述相似度阈值时,确定最大的相似度对应的意图类别,即为所述切分子句对应的要表达的意图。本专利技术提供了一种对话系统的语句智能澄清方法及系统,旨在解决两个主要问题,一是机器如何识别用户带歧义的句子;二是对于带歧义的句子,如何理解以及澄清的方法。针对第一个问题,采用适用于文本领域的SeqGAN生成模型,可同时学习到表示文本概率分布的生成器和识别歧义句子的判别器,其中生成器可用于产生更多的训练数据,而判别器则可以准确识别带歧义的句子,解决了第一个问题;针对第二个问题,通过构建意图分类语料库,歧义句子切分,BERT模型向量化,计算句子相似度的方式,理解用户多意本文档来自技高网...

【技术保护点】
1.一种对话系统的语句智能澄清方法,其特征在于,所述方法包括:/n对获取的用户句子序列进行分词处理,以获取所述用户句子序列中的多个单词;/n将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子;/n当所述用户句子序列为歧义句子时,以中文的结束标点符号为切分依据,对所述用户句子序列进行分句处理,以获取切分子句;/n计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度,根据所述相似度确定切分子句的意图。/n

【技术特征摘要】
1.一种对话系统的语句智能澄清方法,其特征在于,所述方法包括:
对获取的用户句子序列进行分词处理,以获取所述用户句子序列中的多个单词;
将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子;
当所述用户句子序列为歧义句子时,以中文的结束标点符号为切分依据,对所述用户句子序列进行分句处理,以获取切分子句;
计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度,根据所述相似度确定切分子句的意图。


2.根据权利要求1所述的方法,其特征在于,所述将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子,包括:
利用SeqGAN模型获取用户句子序列中每个单词的embedding特征,并经过隐含层函数的映射,得到隐含层状态序列;
所述隐含层状态序列经过softmax层处理,输出每个单词的概率分布;
根据每个单词的概率分布和预设的歧义句子语料库中的数据,采用卷积神经网络进行匹配,以确定所述用户句子序列是否为歧义句子。


3.根据权利要求1所述的方法,其特征在于,所述SeqGAN模型,包括:一个生成器G和一个判别器D,利用如下方式确定所述SeqGAN模型,包括:
收集对话数据中,将用户带歧义的句子语料作为模型的训练集{s1,s2,...,sn},其中每个si为句子序列,表示si={x1:T},xj表示句子中的单个词;
使用训练集对G进行预训练,以最大似然估计作为优化目标;
使用预训练的G生成多个负样本,结合真实的歧义句子对D进行预训练,D训练以交叉熵作为优化目标;
G和D相互博弈进行优化,直至SeqGAN达到收敛,确定所述SeqGAN模型。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于BERT训练模型确定预设的意图语料库中每个意图类别的加权平均向量,包括:



其中,为多个文本的加权平均向量;表示第i类意图的第j个用户表达,为文本对应的相量;i∈{1,2,...m},j∈{1,2,...n}。


5.根据权利要求4所述的方法,其特征在于,所述根据所述相似度确定切分子句的意图,包括:



其中,BERT(xp)为切分子句xp使用BERT预训练模型获得对应的向量;thre为预设的相似度阈值;当切分子句的向量与某个意图类别的加权平均向量的相似度大于所述相似度阈值时,确定最大的相似度对应的意图类别,即为所述切分子句对应的要表达的意图。


6.一种对话系统的语句智能澄清系统,其特征在于,所述系统...

【专利技术属性】
技术研发人员:王亚平王志刚杨硕刘振宇王芳刘雅婷王泽皓
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1