基于特征匹配和领域自适应的对话意图识别方法及系统技术方案

技术编号:30912712 阅读:13 留言:0更新日期:2021-11-23 00:00
本发明专利技术提出了一种基于特征匹配和领域自适应的对话意图识别方法及系统,属于自然语言处理、意图识别技术领域。首先获取客服领域的预训练语言模型;利用对比学习对预训练语言模型进行二次训练,作为句子特征表示模型;针对不同领域,训练领域自适应的特征转换模块;获取由对话语句和目标意图组成的意图语料库,提取对话语句的领域自适应的句子特征并构建特征语料索引库;获取待识别的询问语句对应的领域自适应的句子特征,从特征语料索引库检索与其最匹配的句子特征对应的目标意图作为识别结果。本发明专利技术只需一个基础的句子特征表示模型和多个特征转换模块,解决了复杂的智能客服意图识别问题,提高了意图识别的准确性。提高了意图识别的准确性。提高了意图识别的准确性。

【技术实现步骤摘要】
基于特征匹配和领域自适应的对话意图识别方法及系统


[0001]本专利技术涉及属于自然语言处理、意图识别
,具体涉及一种基于特征匹配和领域自适应的对话意图识别方法及系统。

技术介绍

[0002]近年来,智能客服逐渐取代了传统的人工客服,智能对话系统作为最关键的前沿技术之一,一直受到学术界和工业界的高度关注。其中,对话意图识别作为智能对话系统的核心,是实现智能对话系统必不可少的模块,也是众多研究者的研究方向。
[0003]目前已有的意图识别算法主要分为基于规则的文本匹配算法和基于机器学习的深度学习算法。其中,基于规则的文本匹配算法在小样本数据上表现良好,且计算速度快,准确率较高。但是,该算法基于的字符规则需要大量人工编写,且缺乏语义理解能力,泛化性能较差,尤其对于比较复杂的意图识别问题,规则难以编写和维护。基于机器学习的深度学习算法能够通过大样本的学习,学习到很好的语义表示,但是,该算法对于小样本数据很容易过拟合,泛化性能较差,更重要的是,对于智能客服领域的千人千面需求,常规深度学习算法训练代价较大,成本较高。
[0004]众所周知,智能客服的意图识别存在两方面主要的业务特点,一方面,客服系统存在大量的客户,而不同客户的意图标签是不同的,即千人千面。另一方面,每个客户的意图训练数据量很少,无法针对每个用户去单独训练一个深度学习模型,这样成本极高且小样本数据无法克服过拟合问题。同样,基于规则的文本匹配算法不具备语义理解能力,无法解决复杂的智能客服的意图识别问题。

技术实现思路

[0005]为了解决上述技术问题,本专利技术提出了一种基于特征匹配和领域自适应的对话意图识别方法及系统,具体采用如下技术方案:
[0006]本专利技术的其中一个目的在于提供一种基于特征匹配和领域自适应的对话意图识别方法,其特征在于,包括以下步骤:
[0007]步骤一:获取客服领域的预训练语言模型;
[0008]步骤二:利用对比学习,构建不同领域的正样本对和负样本对,对预训练语言模型进行二次训练,作为句子特征表示模型;
[0009]步骤三:建立包含不同领域对话语句和目标意图标签的意图语料库,针对不同领域的对话语句,训练领域自适应的特征转换模块,每一个领域对应一个特征转换模块;
[0010]步骤四:将意图语料库中的对话语句作为步骤二所述的句子特征表示模型的输入,提取到句子特征,再将句子特征作为步骤三得到的相对应领域下的特征转换模块的输入,生成对应领域下的句子特征,由所述的对应领域下的句子特征和目标意图标签构建特征语料索引库;
[0011]步骤五:针对已知领域的待识别的询问语句,首先利用句子特征表示模型获取待
识别询问语句的句子特征,再将得到的句子特征作为相对应领域下的特征转换模块的输入,生成对应领域下的句子特征;将生成的句子特征与特征语料索引库中的句子特征进行特征匹配,将特征语料索引库中最邻近的句子特征对应的意图标签作为意图识别结果。
[0012]本专利技术的第二个目的在于提供一种上述的基于特征匹配和领域自适应的对话意图识别方法的系统,包括:
[0013]预训练语言模块,其用于将语言模型在客服领域的语料库中进行预训练;
[0014]句子特征表示模块,其用于构建正样本对和负样本对,利用对比学习的方式微调预训练后的语言模型参数,实现语言模型的二次训练,生成询问语句的句子特征;
[0015]特征转换模块,其用于将句子特征表示模块生成的句子特征转换成对应领域下的句子特征;
[0016]语料索引库模块,其由对话语句的对应领域下的句子特征和目标意图标签组成,所述的对应领域下的句子特征是将已有的对话语句依次通过句子特征表示模块和特征转换模块提取得到的;
[0017]意图识别模块,其用于从语料索引库模块中检索与待识别询问语句的对应领域下的句子特征最匹配的句子特征,将检索结果对应的目标意图标签作为识别结果。
[0018]与现有技术相比,本专利技术的优势在于:本专利技术首先通过客服领域的预训练语言模型来降低训练难度,使得提取到的句子特征比较符合领域特性,再通过对比学习微调预训练语言模型的参数,保证句子特征的分布更加适合特征匹配任务,将二次训练好的语言模型作为句子特征表示模型。由于客服系统中大量的客户具有千人千面的特点,每个人的意图标签不同,不同领域下的句子对应的句子标签也可能不同。基于此,本专利技术提出利用LDA模型作为领域自适应的特征转换模块,使得千人千面的意图识别模型成为可能,将不同领域下客户询问语句的句子特征通过特定领域的LDA模型进行转换,得到对应领域下的句子特征,最终通过对比语料索引库中的句子特征即可获得检索到的意图结果,整个系统成本低,LDA模型参数量小,只需一个基础的句子特征表示模型和多个特征转换模块,解决了复杂的智能客服意图识别问题,提高了意图识别的准确性。
附图说明
[0019]此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0020]图1是根据一示例性实施例示出的本专利技术的对话意图识别方法流程图;
[0021]图2是根据一示例性实施例示出正负样本对构造过程示意图。
具体实施方式
[0022]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023]本专利技术提出的基于特征匹配和领域自适应的对话意图识别方法,包括以下步骤:
[0024]步骤一:获取客服领域的预训练语言模型。
[0025]步骤二:利用对比学习,构建不同领域的正样本对和负样本对,对预训练语言模型进行二次训练,作为句子特征表示模型。
[0026]步骤三:建立包含不同领域对话语句和目标意图标签的意图语料库,针对不同领域的对话语句,训练领域自适应的特征转换模块,每一个领域对应一个特征转换模块。
[0027]步骤四:将意图语料库中的对话语句作为步骤二所述的句子特征表示模型的输入,提取到句子特征,再将句子特征作为步骤三得到的相对应领域下的特征转换模块的输入,生成对应领域下的句子特征,由所述的对应领域下的句子特征和目标意图标签构建特征语料索引库。
[0028]步骤五:针对已知领域的待识别的询问语句,首先利用句子特征表示模型获取待识别询问语句的句子特征,再将得到的句子特征作为相对应领域下的特征转换模块的输入,生成对应领域下的句子特征;将生成的句子特征与特征语料索引库中的句子特征进行特征匹配,将特征语料索引库中最邻近的句子特征对应的意图标签作为意图识别结果。
[0029]在本专利技术的一项具体实施中,步骤一采用的客服领域的预训练语言模型为中文BERT模型,在大量未标注的客服语料上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征匹配和领域自适应的对话意图识别方法,其特征在于,包括以下步骤:步骤一:获取客服领域的预训练语言模型;步骤二:利用对比学习,构建不同领域的正样本对和负样本对,对预训练语言模型进行二次训练,作为句子特征表示模型;步骤三:建立包含不同领域对话语句和目标意图标签的意图语料库,针对不同领域的对话语句,训练领域自适应的特征转换模块,每一个领域对应一个特征转换模块;步骤四:将意图语料库中的对话语句作为步骤二所述的句子特征表示模型的输入,提取到句子特征,再将句子特征作为步骤三得到的相对应领域下的特征转换模块的输入,生成对应领域下的句子特征,由所述的对应领域下的句子特征和目标意图标签构建特征语料索引库;步骤五:针对已知领域的待识别的询问语句,首先利用句子特征表示模型获取待识别询问语句的句子特征,再将得到的句子特征作为相对应领域下的特征转换模块的输入,生成对应领域下的句子特征;将生成的句子特征与特征语料索引库中的句子特征进行特征匹配,将特征语料索引库中最邻近的句子特征对应的意图标签作为意图识别结果。2.根据权利要求1所述的一种基于特征匹配和领域自适应的对话意图识别方法,其特征在于,所述的预训练语言模型采用中文BERT模型。3.根据权利要求1所述的一种基于特征匹配和领域自适应的对话意图识别方法,其特征在于,所述的正样本对和负样本对的构建方式为:获取不同领域的N个对话语句样本作为步骤一中的预训练语言模型的输入,得到N个句子特征;将N个句子特征中的随机一个或多个维度置为0,作为添加噪声后的N个句子特征;第i个句子特征与第i个添加噪声后的句子特征构成正样本对,第i个句子特征与第j个添加噪声后的句子特征构成负样本对,j≠i。4.根据权利要求3所述的一种基于特征匹配和领域自适应的对话意图识别方法,其特征在于,所述对比学习的训练目标函数为:其中,L表示训练损失值,sim(.)表示余弦相似度,τ为温度系数,h
i

【专利技术属性】
技术研发人员:姜兴华李澳周夏伟
申请(专利权)人:杭州一知智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1