【技术实现步骤摘要】
意图识别方法、装置、计算机设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及意图识别方法、装置、计算机 设备及存储介质。
技术介绍
[0002]随着社会信息化,基于自然语言处理的智能客服、聊天机器人以及搜索 引擎等基于意图识别技术的应用开始广泛使用。
[0003]传统的意图识别方法一般通过构建意图识别模型,在构建过程中,需要 标注大量语料,并基于已经划分归类好的意图标签,将意图是被任务转换为 分类任务,使用基于机器学习或者深度学习的模型,实现对输入的意图标签 进行分类,实现意图识别的目的。这种方法通常需要大量的标注数据,并且, 在实际应用场景中,由于实际意图的复杂性和多样性,会将一些意图识别成 未知意图,造成在应用场景中的意图识别效果准确程度不高。
技术实现思路
[0004]本专利技术提供一种意图识别方法、装置、计算机设备及存储介质,以提高 未知意图的识别准确率。
[0005]一种意图识别方法,包括:
[0006]从预设的数据库中获取样本标签数据和样本无标签数据,根据 ...
【技术保护点】
【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:从预设的数据库中获取样本标签数据和样本无标签数据,根据预设的正负向分类方法对所述样本标签数据进行分类,得到至少一个输入文本对;将所述输入文本对输入到预设的预训练模型中进行训练,得到初始语义表征模型;将所述样本标签数据输入到所述初始语义表征模型,得到样本标签向量,将所述样本无标签数据输入到所述初始语义表征模型,得到样本无标签向量;根据预设的聚类方法,对所述样本标签向量和所述样本无标签向量进行聚类,得到聚类指数和聚类意图标签数据,其中,所述聚类意图标签数据包括聚类文本和聚类意图标签数据;基于所述聚类指数,通过所述聚类意图标签数据训练所述初始语义表征模型,得到训练好的语义表征模型;从用户端获取用户输入的待识别文本数据,将所述待识别文本数据输入到所述训练好的语义表征模型,得到预测语义向量,将所述样本标签数据输入到所述训练好的语义表征模型,得到验证语义向量;通过所述聚类指数,根据匈牙利算法,计算所述预测语义向量与所述验证语义向量之间的相似度结果,并根据所述相似度结果识别所述待识别文本数据中的未知意图。2.根据权利要求1所述的意图识别方法,其特征在于,所述从预设的数据库中获取样本标签数据和样本无标签数据,根据预设的正负向分类方法对所述样本标签数据进行分类,得到至少一个输入文本对的步骤包括:确定所述样本标签数据中的目标文本,通过向量转换的方式,计算所述目标文本的目标文本向量和所述样本标签数据的其他文本数据的文本向量;计算所述目标文本向量与所述其他文本数量的文本向量的相似度结果,将相似度结果大于第一预设阈值的文本数据作为正向文本,将相似度结果小于第二预设阈值的文本数据作为负向文本;将所述目标文本、所述正向文本以及所述负向文本进行组成,构成输入文本对。3.根据权利要求1所述的意图识别方法,其特征在于,所述从预设的数据库中获取样本标签数据和样本无标签数据,根据预设的正负向分类方法对所述样本标签数据进行分类,得到至少一个输入文本对的步骤包括:确定所述样本标签数据的目标文本以及对应的意图标签,将所述目标文本的意图标签作为目标意图标签;通过文本匹配的方式,计算目标意图标签与所述样本标签数据中的意图标签的相似度结果,相似度结果大于第一预设阈值的意图标签对应的文本数据作为正向文本,相似度结果小于第二预设阈值的意图标签对应的文本数据作为负向文本;将所述目标文本、所述正向文本以及所述负向文本进行组合,得到输入文本对。4.根据权利要求1所述的意图识别方法,其特征在于,所述将所述输入文本对输入到预设好的预训练模型中进行训练,得到初始语义表征模型的步骤包括:基于注意力机制构建预训练模型,并构建正向损失函数和负向损失函数;通过所述正向损失函数和负向损失函数对所述预训练模型进行参数调整,得到初始语义表征模型。
5.根据权利要求1所述的意图识别方法,其特征在于,所述根据预设的聚类方法,对所述样本标签向量和所述样本无标签向量进行聚类,得到聚类指数和聚类意图标签数据的步骤包括:根据预设的聚类簇数量,通过k
‑
means聚类方式,对所述样本标签向量和样本无标...
【专利技术属性】
技术研发人员:任俊松,侯晓龙,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。