一种对话意图的识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：27843882 阅读：12 留言：0更新日期：2021-03-30 12:42

本申请公开了一种对话意图的识别方法、装置、电子设备及存储装置，涉及人工智能、深度学习等机器学习技术领域。该方案为：获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子；将样本句子和支撑句子输入至预先训练好的意图识别模型中，意图识别模型根据样本句子和支撑句子生成样本句子对应的样本句子向量和支撑句子对应的类别向量，计算样本句子向量和类别向量之间的匹配度，根据多个匹配度得到样本句子的预测意图类别。本申请结合小样本学习技术，降低了意图识别模型对支撑句子规模的依赖程度，避免了基于少量支撑句子进行识别时导致的过拟合现象，确保了对话意图识别结果的准确率，提高了对话意图的识别过程中的可靠性。靠性。靠性。

全部详细技术资料下载

【技术实现步骤摘要】
一种对话意图的识别方法、装置、电子设备及存储介质

[0001]本申请的实施例总体上涉及数据处理
，并且更具体地涉及人工智能、深度学习等机器学习

技术介绍

[0002]近年来，随着对话领域相关技术的兴起，对话意图的识别也逐渐成为了重要的研究方向之一。在对话意图的识别过程中，通常依赖标注数据作为对话意图识别的基础。
[0003]然而，现有技术中的对话意图的识别方法，特别是在真实的对话场景的冷启动阶段中，由于标注数据规模极小，势必会因极易产生过拟合(Overfitting)现象导致对话意图的识别结果准确率极低。因此，如何提高对话意图的识别结果的准确率，已成为了重要的研究方向之一。

技术实现思路

[0004]本申请提供了一种对话意图的识别方法、装置、电子设备及存储介质。
[0005]根据第一方面，提供了一种对话意图的识别方法，包括：
[0006]获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子；
[0007]将所述样本句子和所述支撑句子输入至预先训练好的意图识别模型中，所述意图识别模型根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量和所述支撑句子对应的类别向量，计算所述样本句子向量和所述类别向量之间的匹配度，根据多个所述匹配度得到所述样本句子的预测意图类别。
[0008]根据第二方面，提供了一种对话意图的识别装置，包括：
[0009]获取模块，用于获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子；
[0...

【技术保护点】

【技术特征摘要】
1.一种对话意图的识别方法，包括：获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子；将所述样本句子和所述支撑句子输入至预先训练好的意图识别模型中，所述意图识别模型根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量和所述支撑句子对应的类别向量，计算所述样本句子向量和所述类别向量之间的匹配度，根据多个所述匹配度得到所述样本句子的预测意图类别。2.根据权利要求1所述的识别方法，根据所述样本句子和所述支撑句子生成所述支撑句子对应的类别向量，包括：根据所述样本句子和所述支撑句子生成所述支撑句子对应的支撑句子向量；根据所述支撑句子向量生成所述支撑句子对应的所述类别向量。3.根据权利要求2所述的识别方法，所述根据所述样本句子和所述支撑句子生成所述支撑句子对应的支撑句子向量，包括：根据所述样本句子生成对应的样本词向量序列；根据所述支撑句子生成对应的支撑词向量序列；将所述样本词向量序列输入至时间循环神经网络序列模型中，得到所述样本句子中样本单词的输出隐状态；将所述支撑词向量序列输入至所述时间循环神经网络序列模型中，得到所述支撑句子中支撑单词的输出隐状态；根据所述样本单词的输出隐状态和所述支撑单词的输出隐状态，生成所述支撑句子对应的输出向量序列；根据所述支撑句子对应的输出向量序列生成所述支撑句子向量。4.根据权利要求1所述的识别方法，所述根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量，包括：根据所述样本句子生成对应的样本词向量序列；根据所述支撑句子生成对应的支撑词向量序列；将所述样本词向量序列输入至时间循环神经网络序列模型中，得到所述样本句子中样本单词的输出隐状态；将所述支撑词向量序列输入至所述时间循环神经网络序列模型中，得到所述支撑句子中支撑单词的输出隐状态；根据所述样本单词的输出隐状态和所述支撑单词的输出隐状态，生成所述样本句子对应的输出向量序列；根据所述样本句子对应的输出向量序列生成所述样本句子向量。5.根据权利要求3
‑
4所述的识别方法，所述根据所述样本句子生成对应的样本词向量序列，包括：对所述样本句子进行分词处理，得到多个所述样本单词；对所述样本单词进行词性标注，得到样本单词词性；对所述样本单词进行命名实体识别，得到样本单词命名实体；根据所述样本单词、所述样本单词词性和所述样本单词命名实体，生成所述样本句子对应的所述样本词向量序列。6.根据权利要求3
‑
4所述的识别方法，所述根据所述支撑句子生成对应的支撑词向量
序列，包括：对所述支撑句子进行分词处理，得到多个所述支撑单词；对所述支撑单词进行词性标注，得到支撑单词词性；对所述支撑单词进行命名实体识别，得到支撑单词命名实体；根据所述支撑单词、所述支撑单词词性和所述支撑单词命名实体，生成所述支撑句子对应的所述支撑词向量序列。7.根据权利要求4所述的识别方法，所述根据所述样本句子对应的输出向量序列生成所述样本句子向量，包括：获取所述样本句子中所述样本单词在语料库中的样本词频和样本逆文档频率；根据所述样本词频和所述样本逆文档频率生成所述样本单词对应的输出向量的权重；根据所述样本句子对应的输出向量序列中的输出向量和对应的权重，生成所述样本句子向量。8.根据权利要求3所述的识别方法，所述根据所述支撑句子对应的输出向量序列生成所述支撑句子向量，包括：获取所述支撑句子中所述支撑单词在语料库中的支撑词频和支撑逆文档频率；根据所述支撑词频和所述支撑逆文档频率生成所述支撑单词对应的输出向量的权重；根据所述支撑句子对应的输出向量序列中的输出向量和对应的权重，生成所述支撑句子向量。9.根据权利要求2所述的识别方法，所述根据所述支撑句子向量生成所述支撑句子对应的所述类别向量，包括：获取同一标注意图类别的所述支撑句子向量；根据同一标注意图类别的所述支撑句子向量生成该标注意图类别对应的所述类别向量。10.根据权利要求1所述的识别方法，所述根据多个所述匹配度得到所述样本句子的预测意图类别，包括：将多个所述匹配度中最大匹配度对应的所述类别向量的标注意图类别，确定为所述样本句子的预测意图类别。11.根据权利要求1所述的识别方法，还包括：获取已标注意图类别的第一训练句子和多个第二训练句子；将所述第一训练句子和所述第二训练句子输入至待训练的意图识别模型中，得到所述第一训练句子对应的预测意图类别；根据所述第一训练句子对应的预测意图类别和所述第一训练句子对应的标注意图类别的差异，调整所述待训练的意图识别模型中的模型参数，并返回所述获取已标注意图类别的第一训练句子和多个第二训练句子步骤，直至所述第一训练句子对应的预测意图类别和所述第一训练句子对应的标注意图类别的差异符合预设的训练结束条件，将最后一次调整模型参数后的所述待训练的意图识别模型确定为所述训练好的意图识别模型。12.一种对话意图的识别装置，包括：第一获取模块，用于获取待预测意图类别的样本句子和多个已标注意图类别的支撑句子；
生成模块，用于将所述样本句子和所述支撑句子输入至预先训练好的意图识别模型中，所述意图识别模型根据所述样本句子和所述支撑句子生成所述样本句子对应的样本句子向量和所述支撑句子对应的类别向量，计算所述样本句子向量和所述类别向量之间的匹配度，根据多个所述匹配度得到...

【专利技术属性】
技术研发人员：郭洪杰，张红阳，焦振宇，孙叔琦，常月，李婷婷，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人