基于损失函数的意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号：25043416 阅读：13 留言：0更新日期：2020-07-29 05:33

本发明专利技术涉及人工智能领域，公开了基于损失函数的意图识别方法、装置、设备及存储介质，用于直接计算文本中每个标签对损失函数的影响，提高了模型对多个意图的识别能力。本发明专利技术方法包括：获取待识别文本，待识别文本用于指示目标用户的至少一个意图；调用改进的机器学习模型FastText的输入层对待识别文本进行分词，得到多个分词向量；调用改进的FastText的隐藏层对多个分词向量进行叠加平均，得到文档向量；调用二分类用的交叉熵损失函数BCELoss对文档向量中的每个潜在意图进行计算，得到多个潜在意图的损失值；根据每个潜在意图对应的损失值以及预先设置的阈值对多个潜在意图的损失值进行筛选，基于筛选后的损失值确定待识别文本的多个候选意图标签。

全部详细技术资料下载

【技术实现步骤摘要】
基于损失函数的意图识别方法、装置、设备及存储介质
本专利技术涉及分类算法
，尤其涉及一种基于损失函数的意图识别方法、装置、设备及存储介质。
技术介绍
在多轮对话系统中自然语言理解(naturallanguageunderstanding，NLU)是机器从用户身上获取信息至关重要的一个步骤。对于文本的意图识别是自然语言理解最常用的方法之一，但是常见的意图识别都局限于一句话对应一个意图，分类器将用户的话分到事先设计好的多个分类中的某一类当中去，也就是多分类方法。而实际的情况是用户的一句话常常表达了不止一个意图，在这种情况下单单只识别意图就无法满足业务需求了。因此，对话系统需要一个可以同时识别用户多种意图的自然语言理解模块，也就是要将传统的单意图识别扩展到多意图识别的领域。而多意图识别在业界一直是一个难题，通常的方法就是使用规则匹配，其原理就是靠人工事先为所有的意图设计关键词，若一句话匹配到了多个关键词就认为命中了多个意图，但这种方式存在扩展性差、人工工作量大，情况覆盖不全等缺点。
技术实现思路
本专利技术提供了一种基于损失函数的意图识别方法、装置、设备及存储介质，用于直接计算文本中每个标签对损失函数的影响，调整文本在所有意图中的概率分布，让所有标签位置上的损失都被计算在内，从而提高标签所在位置的置信度，并降低其余位置的置信度，并提高了模型对多个意图的识别能力。本专利技术实施例的第一方面提供一种基于损失函数的意图识别方法，包括：获取待识别文本，所述待识别文本用于指示目标用户的至少一...

【技术保护点】
1.一种基于损失函数的意图识别方法，其特征在于，包括：/n获取待识别文本，所述待识别文本用于指示目标用户的至少一个意图；/n调用改进的机器学习模型FastText的输入层对所述待识别文本进行分词，得到多个分词向量；/n调用所述改进的FastText的隐藏层对所述多个分词向量进行叠加平均，得到文档向量；/n调用二分类用的交叉熵损失函数BCELoss对所述文档向量中的每个潜在意图进行计算，得到多个潜在意图的损失值；/n根据每个潜在意图对应的损失值以及预先设置的阈值对所述多个潜在意图的损失值进行筛选，基于筛选后的损失值确定所述待识别文本的多个候选意图标签。/n

【技术特征摘要】
1.一种基于损失函数的意图识别方法，其特征在于，包括：
获取待识别文本，所述待识别文本用于指示目标用户的至少一个意图；
调用改进的机器学习模型FastText的输入层对所述待识别文本进行分词，得到多个分词向量；
调用所述改进的FastText的隐藏层对所述多个分词向量进行叠加平均，得到文档向量；
调用二分类用的交叉熵损失函数BCELoss对所述文档向量中的每个潜在意图进行计算，得到多个潜在意图的损失值；
根据每个潜在意图对应的损失值以及预先设置的阈值对所述多个潜在意图的损失值进行筛选，基于筛选后的损失值确定所述待识别文本的多个候选意图标签。

2.根据权利要求1所述的基于损失函数的意图识别方法，其特征在于，所述调用二分类用的交叉熵损失函数BCELoss对所述文档向量中的每个潜在意图进行计算，得到多个潜在意图的损失值，包括：
将文档向量输入到改进的FastText中进行负采样，得到多个采样向量；
调用分层分类器将所述多个采样向量导入树形结构，得到树形分类结构，所述树形分类结构包括多个潜在意图标签；
通过S型阈值函数Sigmoid和二分类用的交叉熵损失函数BCELoss对所述多个潜在意图标签进行计算，得到多个潜在意图的损失值。

3.根据权利要求2所述的基于损失函数的意图识别方法，其特征在于，所述通过S型阈值函数Sigmoid和二分类用的交叉熵损失函数BCELoss对所述多个潜在意图标签进行计算，得到多个潜在意图的损失值，包括：
通过阈值函数Sigmoid将多个潜在意图标签的计算概率值y′；
根据获取到的真实概率值y和预置BCELoss公式计算多个潜在意图标签的损失值，其中，预置BCELoss公式为l＝-ylogy′-(1-y)log(1-y′)。

4.根据权利要求1所述的基于损失函数的意图识别方法，其特征在于，所述根据每个潜在意图对应的损失值以及预先设置的阈值对所述多个潜在意图的损失值进行筛选，基于筛选后的损失值确定所述待识别文本的多个候选意图标签，包括：
获取预先设置的阈值；
判断每个潜在意图对应的损失值是否大于所述阈值；
若目标损失值大于所述阈值，则将所述目标损失值对应的潜在意图确定为所述待识别文本的候选意图标签，得到多个候选意图标签。

5.根据权利要求1所述的基于损失函数的意图识别方法，其特征在于，所述调用改进的机器学习模型FastText的输入层对...

【专利技术属性】
技术研发人员：阮晓义，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人