System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 多标签文本意图分类方法、装置和计算机设备制造方法及图纸_技高网

多标签文本意图分类方法、装置和计算机设备制造方法及图纸

技术编号:41280617 阅读:4 留言:0更新日期:2024-05-11 09:31
本申请属于人工智能技术领域,特别涉及一种多标签文本意图分类方法、装置和计算机设备。将输入文本输入检索式意图分类模型,将第一意图分最高/最低的意图分类标签设为第一/第二目标意图分类标签;获取第一、第二目标意图分类标签的类别和第一最高、最低意图分;将输入文本输入分类式意图分类模型,获取各意图分类便签的第二意图分;将各意图分类标签的类别按第二意图分由高到低的顺序进行排序,得到第一序列;基于第一、第二目标意图分类标签的类别和第一最高、最低意图分,及第一序列,执行分数融合操作,获得各意图分类标签的融合意图分;基于融合意图分获得输入文本的意图分类结果。上述方法、装置和计算机设备可提高文本意图分类的准确性。

【技术实现步骤摘要】

本申请涉及人工智能,具体而言,本申请涉及一种多标签文本意图分类方法、装置和计算机设备


技术介绍

1、在对输入文本进行意图分类时,通常有两种方式:检索式和分类式。检索式采用相似度计算的无监督方式,可以分别给出每个意图的分数,可以分别提供多标签意图,且不受标签不平衡的影响,然而这种方式缺乏泛化能力,只有样本语句和输入文本语句相似才能有比较好的效果,如果输入和样本都缺乏相似度,效果将不好;而分类式在泛化性这个问题上却有比较好的效果,因为其是综合所有样本给出的最终意图分,但分类式受到数据不平衡影响大。


技术实现思路

1、本申请的主要目的为提供一种多标签文本意图分类方法、装置和计算机设备,旨在解决使用现有意图分类方法所获得的多标签文本意图分类的准确性较低的技术问题。

2、为了实现上述专利技术目的,本申请提供一种多标签文本意图分类方法,包括:

3、获取待分类的输入文本;

4、将所述输入文本输入检索式意图分类模型,获取所述输入文本与所述检索式意图分类模型的各意图分类标签的相似度;

5、根据所述相似度,获得各所述意图分类标签的第一意图分,将所述第一意图分最高的意图分类标签设为第一目标意图分类标签,以及将所述第一意图分最低的意图分类标签设为第二目标意图分类标签;

6、获取所述第一目标意图分类标签的类别和对应的第一最高意图分,以及获取所述第二目标意图分类标签的类别和对应的第一最低意图分;

7、将所述输入文本输入分类式意图分类模型,获取各所述意图分类便签的第二意图分;

8、将所述各意图分类标签的类别按各所述意图分类标签的第二意图分由高到低的顺序进行排序,得到第一序列;

9、基于所述第一目标意图分类标签的类别、所述第二目标意图分类标签的类别、第一最高意图分、第一最低意图分和所述第一序列,执行分数融合操作,获得各所述意图分类标签的融合意图分;

10、基于所述融合意图分获得所述输入文本的意图分类结果。

11、在一些实施例中,所述检索式意图分类模型由bert模型和flow模型构成;

12、所述bert模型包括12或24个编码器层,所述flow模型包括若干个耦合层,所述bert模型用于将所述输入文本转换为句向量,所述flow模型用于将所述句向量的分布转换为高斯分布。

13、在一些实施例中,所述分类式意图分类模型包括若干个文本编码器和若干个知识编码器;

14、所述文本编码器用于获取所述输入文本中各字符的词汇信息和语义信息,并将所述词汇信息和语义信息作为文本信息输出,所述知识编码器用于将所述输入文本的实体信息加入到所述文本编码器输出的文本信息中,其中,所述实体信息包括具有实际指向意义的词语或短语。

15、在一些实施例中,所述分类式意图分类模型的训练损失包括去噪损失,所述去噪损失由下式获得:

16、

17、其中,ωi为所述输入文本的第i个字符向量,所述ej为所述输入文本的第j个实体向量,ek为所述输入文本的m个实体向量中的第k个实体向量,为第一层所述知识编码器的输出字符向量。

18、在一些实施例中,所述分类式意图分类模型的训练损失由如下公式获得:

19、

20、其中,为第j个与目标向量id相同的样本向量,为第i个与目标向量id不同的样本向量,γ用于损失尺度缩放,m用于控制sn与sp的分离度。

21、在一个实施例中,所述执行分数融合操作的步骤,包括:

22、利用dempster合成规则执行分数融合操作。

23、在一些实施例中,在所述执行分数融合操作的步骤之前,包括:

24、对所述第一意图分和所述第二意图分进行空间统一。

25、本申请还提供一种多标签文本意图分类装置,包括:

26、输入文本获取模块,用于获取待分类的输入文本;

27、相似度获取模块,用于将所述输入文本输入检索式意图分类模型,获取所述输入文本与所述检索式意图分类模型的各意图分类标签的相似度;

28、目标意图分类标签设定模块,用于根据所述相似度,获得各所述意图分类标签的第一意图分,将所述第一意图分最高的意图分类标签设为第一目标意图分类标签,以及将所述第一意图分最低的意图分类标签设为第二目标意图分类标签;

29、第一意图分获取模块,获取所述第一目标意图分类标签的类别和对应的第一最高意图分,以及获取所述第二目标意图分类标签的类别和对应的第一最低意图分;

30、第二意图分获取模块,用于将所述输入文本输入分类式意图分类模型,获取各所述意图分类便签的第二意图分;

31、第一序列获取模块,用于将所述各意图分类标签的类别按各所述意图分类标签的第二意图分由高到低的顺序进行排序,得到第一序列;

32、融合意图分获取模块,基于所述第一目标意图分类标签的类别、所述第二目标意图分类标签的类别、第一最高意图分、第一最低意图分和所述第一序列,执行分数融合操作,获得各所述意图分类标签的融合意图分;

33、意图分类结果获取模块,用于基于所述融合意图分获得所述输入文本的意图分类结果。

34、本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例提供的多标签文本意图分类方法的步骤。

35、本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例提供的多标签文本意图分类方法中的步骤。

36、本申请所提供的一种多标签文本意图分类方法、装置和计算机设备,包括:获取待分类的输入文本;将所述输入文本输入检索式意图分类模型,获取所述输入文本与所述检索式意图分类模型的各意图分类标签的相似度;根据所述相似度,获得各所述意图分类标签的第一意图分,将所述第一意图分最高的意图分类标签设为第一目标意图分类标签,以及将所述第一意图分最低的意图分类标签设为第二目标意图分类标签;获取所述第一目标意图分类标签的类别和对应的第一最高意图分,以及获取所述第二目标意图分类标签的类别和对应的第一最低意图分;将所述输入文本输入分类式意图分类模型,获取各所述意图分类便签的第二意图分;将所述各意图分类标签的类别按各所述意图分类标签的第二意图分由高到低的顺序进行排序,得到第一序列;基于所述第一目标意图分类标签的类别、所述第二目标意图分类标签的类别、第一最高意图分、第一最低意图分和所述第一序列,执行分数融合操作,获得各所述意图分类标签的融合意图分;基于所述融合意图分获得所述输入文本的意图分类结果。通过对检索式与分类式意图分类模型的分类结果进行分数融合,即利用检索式的方法对分类式的方法进行优化,可以削弱数据不平衡对分类结果带来的负面影响,从而提高了多标签文本意图分类的准确性。

本文档来自技高网...

【技术保护点】

1.一种多标签文本意图分类方法,其特征在于,包括:

2.根据权利要求1所述的多标签文本意图分类方法,其特征在于,所述检索式意图分类模型由BERT模型和Flow模型构成;

3.根据权利要求1所述的多标签文本意图分类方法,其特征在于,所述分类式意图分类模型包括若干个文本编码器和若干个知识编码器;

4.根据权利要求3所述的多标签文本意图分类方法,其特征在于,所述分类式意图分类模型的训练损失包括去噪损失,所述去噪损失由下式获得:

5.根据权利要求3所述的多标签文本意图分类方法,其特征在于,所述分类式意图分类模型的训练损失由如下公式获得:

6.根据权利要求1所述的多标签文本意图分类方法,其特征在于,所述执行分数融合操作的步骤,包括:

7.根据权利要求1所述的多标签文本意图分类方法,其特征在于,在所述执行分数融合操作的步骤之前,包括:

8.一种多标签文本意图分类装置,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7任一项所述的多标签文本意图分类方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的多标签文本意图分类方法的步骤。

...

【技术特征摘要】

1.一种多标签文本意图分类方法,其特征在于,包括:

2.根据权利要求1所述的多标签文本意图分类方法,其特征在于,所述检索式意图分类模型由bert模型和flow模型构成;

3.根据权利要求1所述的多标签文本意图分类方法,其特征在于,所述分类式意图分类模型包括若干个文本编码器和若干个知识编码器;

4.根据权利要求3所述的多标签文本意图分类方法,其特征在于,所述分类式意图分类模型的训练损失包括去噪损失,所述去噪损失由下式获得:

5.根据权利要求3所述的多标签文本意图分类方法,其特征在于,所述分类式意图分类模型的训练损失由如下公式获得:

6.根据权利要...

【专利技术属性】
技术研发人员:李贤刘卓
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1