一种对话意图的识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:27843882 阅读:12 留言:0更新日期:2021-03-30 12:42
本申请公开了一种对话意图的识别方法、装置、电子设备及存储装置,涉及人工智能、深度学习等机器学习技术领域。该方案为:获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子;将样本句子和支撑句子输入至预先训练好的意图识别模型中,意图识别模型根据样本句子和支撑句子生成样本句子对应的样本句子向量和支撑句子对应的类别向量,计算样本句子向量和类别向量之间的匹配度,根据多个匹配度得到样本句子的预测意图类别。本申请结合小样本学习技术,降低了意图识别模型对支撑句子规模的依赖程度,避免了基于少量支撑句子进行识别时导致的过拟合现象,确保了对话意图识别结果的准确率,提高了对话意图的识别过程中的可靠性。靠性。靠性。

【技术实现步骤摘要】
一种对话意图的识别方法、装置、电子设备及存储介质


[0001]本申请的实施例总体上涉及数据处理
,并且更具体地涉及人工智能、深度学习等机器学习


技术介绍

[0002]近年来,随着对话领域相关技术的兴起,对话意图的识别也逐渐成为了重要的研究方向之一。在对话意图的识别过程中,通常依赖标注数据作为对话意图识别的基础。
[0003]然而,现有技术中的对话意图的识别方法,特别是在真实的对话场景的冷启动阶段中,由于标注数据规模极小,势必会因极易产生过拟合(Overfitting)现象导致对话意图的识别结果准确率极低。因此,如何提高对话意图的识别结果的准确率,已成为了重要的研究方向之一。

技术实现思路

[0004]本申请提供了一种对话意图的识别方法、装置、电子设备及存储介质。
[0005]根据第一方面,提供了一种对话意图的识别方法,包括:
[0006]获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子;
[0007]将所述样本句子和所述支撑句子输入至预先训练好的意图识别模型中,所述意图识别模型根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量和所述支撑句子对应的类别向量,计算所述样本句子向量和所述类别向量之间的匹配度,根据多个所述匹配度得到所述样本句子的预测意图类别。
[0008]根据第二方面,提供了一种对话意图的识别装置,包括:
[0009]获取模块,用于获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子;
[0010]生成模块,用于将所述样本句子和所述支撑句子输入至预先训练好的意图识别模型中,所述意图识别模型根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量和所述支撑句子对应的类别向量,计算所述样本句子向量和所述类别向量之间的匹配度,根据多个所述匹配度得到所述样本句子的预测意图类别。
[0011]根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请第一方面所述的对话意图的识别方法。
[0012]根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请第一方面所述的对话意图的识别方法。
[0013]根据第五方面,提供了一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现本申请第一方面所述的对话意图的识别方法的步骤。
[0014]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特
征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0015]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0016]图1是根据本申请第一实施例的示意图;
[0017]图2是一种支撑句子分为多个不同类别的示意图;
[0018]图3是根据本申请第二实施例的示意图;
[0019]图4是一种特征提取处理过程的示意图;
[0020]图5是根据本申请第三实施例的示意图;
[0021]图6是根据本申请第四实施例的示意图;
[0022]图7是根据本申请第五实施例的示意图;
[0023]图8是一种生成样本词向量序列过程的示意图;
[0024]图9是根据本申请第六实施例的示意图;
[0025]图10是根据本申请第七实施例的示意图;
[0026]图11是根据本申请第八实施例的示意图;
[0027]图12是根据本申请第九实施例的示意图;
[0028]图13是一种获取类别向量过程的示意图;
[0029]图14是一种对向量对进行打分过程的示意图;
[0030]图15是根据本申请第九实施例的示意图;
[0031]图16是用来实现本申请实施例的对话意图的识别方法的对话意图的识别装置的框图;
[0032]图17是用来实现本申请实施例的对话意图的识别方法的对话意图的识别装置的框图;
[0033]图18是用来实现本申请实施例的对话意图的识别的电子设备的框图。
具体实施方式
[0034]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0035]以下对本申请的方案涉及的
进行简要说明:
[0036]AI(Artificial Intelligence,人工智能),是研究使计算机来模拟人生的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术,也有软件层面的技术。人工智能硬件技术一般包括计算机视觉技术、语音识别技术、自然语言处理技术以及及其学习/深度学习、大数据处理技术、知识图谱技术等几大方面。
[0037]DL(Deep Learning,深度学习),是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
[0038]ML(Machine Learning,机器学习),是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。
[0039]下面参考附图描述本申请实施例的对话意图的识别方法、装置、电子设备及存储介质。
[0040]图1是根据本申请第一实施例的示意图。其中,需要说明的是,本申请实施例的对话意图的识别方法的执行主体为对话意图的识别装置,对话意图的识别装置具体可以为硬件设备,或者硬件设备中的软件等。其中,硬件设备例如终端设备、服务器等。如图1所示,本实施例提出的对话意图的识别方法,包括如下步骤:
[0041]S101、获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子。
[0042]本申请实施例中,可以通过判断待预测意图类别的样本句子是否属于已有的某个对话意图的过程,实现对话意图的识别。即言,可以通过判断待预测意图类别的样本句子是否属于其中一个已标注意图类别的支撑句子的过程,实现对话意图的识别。
[0043]其中,待预测意图类别的样本句子,可以为输入的任一未标注意图类别的句子。
[0044]其中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话意图的识别方法,包括:获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子;将所述样本句子和所述支撑句子输入至预先训练好的意图识别模型中,所述意图识别模型根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量和所述支撑句子对应的类别向量,计算所述样本句子向量和所述类别向量之间的匹配度,根据多个所述匹配度得到所述样本句子的预测意图类别。2.根据权利要求1所述的识别方法,根据所述样本句子和所述支撑句子生成所述支撑句子对应的类别向量,包括:根据所述样本句子和所述支撑句子生成所述支撑句子对应的支撑句子向量;根据所述支撑句子向量生成所述支撑句子对应的所述类别向量。3.根据权利要求2所述的识别方法,所述根据所述样本句子和所述支撑句子生成所述支撑句子对应的支撑句子向量,包括:根据所述样本句子生成对应的样本词向量序列;根据所述支撑句子生成对应的支撑词向量序列;将所述样本词向量序列输入至时间循环神经网络序列模型中,得到所述样本句子中样本单词的输出隐状态;将所述支撑词向量序列输入至所述时间循环神经网络序列模型中,得到所述支撑句子中支撑单词的输出隐状态;根据所述样本单词的输出隐状态和所述支撑单词的输出隐状态,生成所述支撑句子对应的输出向量序列;根据所述支撑句子对应的输出向量序列生成所述支撑句子向量。4.根据权利要求1所述的识别方法,所述根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量,包括:根据所述样本句子生成对应的样本词向量序列;根据所述支撑句子生成对应的支撑词向量序列;将所述样本词向量序列输入至时间循环神经网络序列模型中,得到所述样本句子中样本单词的输出隐状态;将所述支撑词向量序列输入至所述时间循环神经网络序列模型中,得到所述支撑句子中支撑单词的输出隐状态;根据所述样本单词的输出隐状态和所述支撑单词的输出隐状态,生成所述样本句子对应的输出向量序列;根据所述样本句子对应的输出向量序列生成所述样本句子向量。5.根据权利要求3

4所述的识别方法,所述根据所述样本句子生成对应的样本词向量序列,包括:对所述样本句子进行分词处理,得到多个所述样本单词;对所述样本单词进行词性标注,得到样本单词词性;对所述样本单词进行命名实体识别,得到样本单词命名实体;根据所述样本单词、所述样本单词词性和所述样本单词命名实体,生成所述样本句子对应的所述样本词向量序列。6.根据权利要求3

4所述的识别方法,所述根据所述支撑句子生成对应的支撑词向量
序列,包括:对所述支撑句子进行分词处理,得到多个所述支撑单词;对所述支撑单词进行词性标注,得到支撑单词词性;对所述支撑单词进行命名实体识别,得到支撑单词命名实体;根据所述支撑单词、所述支撑单词词性和所述支撑单词命名实体,生成所述支撑句子对应的所述支撑词向量序列。7.根据权利要求4所述的识别方法,所述根据所述样本句子对应的输出向量序列生成所述样本句子向量,包括:获取所述样本句子中所述样本单词在语料库中的样本词频和样本逆文档频率;根据所述样本词频和所述样本逆文档频率生成所述样本单词对应的输出向量的权重;根据所述样本句子对应的输出向量序列中的输出向量和对应的权重,生成所述样本句子向量。8.根据权利要求3所述的识别方法,所述根据所述支撑句子对应的输出向量序列生成所述支撑句子向量,包括:获取所述支撑句子中所述支撑单词在语料库中的支撑词频和支撑逆文档频率;根据所述支撑词频和所述支撑逆文档频率生成所述支撑单词对应的输出向量的权重;根据所述支撑句子对应的输出向量序列中的输出向量和对应的权重,生成所述支撑句子向量。9.根据权利要求2所述的识别方法,所述根据所述支撑句子向量生成所述支撑句子对应的所述类别向量,包括:获取同一标注意图类别的所述支撑句子向量;根据同一标注意图类别的所述支撑句子向量生成该标注意图类别对应的所述类别向量。10.根据权利要求1所述的识别方法,所述根据多个所述匹配度得到所述样本句子的预测意图类别,包括:将多个所述匹配度中最大匹配度对应的所述类别向量的标注意图类别,确定为所述样本句子的预测意图类别。11.根据权利要求1所述的识别方法,还包括:获取已标注意图类别的第一训练句子和多个第二训练句子;将所述第一训练句子和所述第二训练句子输入至待训练的意图识别模型中,得到所述第一训练句子对应的预测意图类别;根据所述第一训练句子对应的预测意图类别和所述第一训练句子对应的标注意图类别的差异,调整所述待训练的意图识别模型中的模型参数,并返回所述获取已标注意图类别的第一训练句子和多个第二训练句子步骤,直至所述第一训练句子对应的预测意图类别和所述第一训练句子对应的标注意图类别的差异符合预设的训练结束条件,将最后一次调整模型参数后的所述待训练的意图识别模型确定为所述训练好的意图识别模型。12.一种对话意图的识别装置,包括:第一获取模块,用于获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子;
生成模块,用于将所述样本句子和所述支撑句子输入至预先训练好的意图识别模型中,所述意图识别模型根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量和所述支撑句子对应的类别向量,计算所述样本句子向量和所述类别向量之间的匹配度,根据多个所述匹配度得到...

【专利技术属性】
技术研发人员:郭洪杰张红阳焦振宇孙叔琦常月李婷婷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1