System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 分类方法、装置、设备、存储介质及产品制造方法及图纸_技高网

分类方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:39936241 阅读:5 留言:0更新日期:2024-01-08 22:12
本申请公开了一种分类方法、装置、设备、存储介质及产品,属于人工智能技术领域。上述方法包括:获取至少两个分类模型,上述至少两个分类模型各自对应的业务场景均与目标模型对应的业务场景相关;获取上述业务场景下无标注的、用户账户相关的训练数据;根据上述训练数据,对上述至少两个分类模型中的每一分类模型的知识进行基于相关度的知识蒸馏,训练上述目标模型,上述相关度表征上述每一分类模型与上述目标模型的相关程度;获取上述业务场景下的目标账户,将上述目标账户输入训练后的目标模型,得到上述目标账户对应的分类结果。本申请实施例可以在无标注场景下,依赖相关多个非冷启动状态模型,通过知识蒸馏的方式提升用于进行用户账户分类的模型的冷启动效果。

【技术实现步骤摘要】

本申请涉及人工智能,特别涉及一种分类方法、装置、设备、存储介质及产品


技术介绍

1、在互联网技术快速发展的时代,随着业务场景的不断扩展,和业务场景下对于用户账户分类的要求的不断提升,需要根据实际的需求不断训练新的用于进行用户账户分类的模型,对于每一新的用户账户分类模型而言,就不可避免存在冷启动问题,而相关技术的冷启动解决方案通常较多依赖于专家知识,或者依赖知识迁移或者单一模型的知识蒸馏,但是专家知识很多情况下难以获取,而知识迁移或者单一模型的知识蒸馏的适用场景也十分有限,这就导致了很多场景下冷启动效果差的问题难以被解决。


技术实现思路

1、本申请实施例提供了一种分类方法、装置、设备、存储介质及产品,能够在无标注场景下,依赖相关多个非冷启动状态模型,通过知识蒸馏的方式提升用于进行用户账户分类的模型的冷启动效果,尤其适合在冷启动场景中快速进行分类。

2、根据本申请实施例的一个方面,提供了一种分类方法,所述方法包括:

3、获取至少两个分类模型,所述至少两个分类模型各自对应的业务场景均与目标模型对应的业务场景相关;

4、获取所述业务场景下无标注的、用户账户相关的训练数据;

5、根据所述训练数据,对所述至少两个分类模型中的每一分类模型的知识进行基于相关度的知识蒸馏,训练所述目标模型,所述相关度表征所述每一分类模型与所述目标模型的相关程度;

6、获取所述业务场景下的目标账户,将所述目标账户输入训练后的目标模型,得到所述目标账户对应的分类结果。

7、根据本申请实施例的一个方面,提供了一种分类装置,所述装置包括:

8、关联模型获取模块,用于获取至少两个分类模型,所述至少两个分类模型各自对应的业务场景均与目标模型对应的业务场景相关;

9、训练数据获取模块,用于获取所述业务场景下无标注的、用户账户相关的训练数据;

10、知识蒸馏模型,用于根据所述训练数据,对所述至少两个分类模型中的每一分类模型的知识进行基于相关度的知识蒸馏,训练所述目标模型,所述相关度表征所述每一分类模型与所述目标模型的相关程度;

11、分类模型,用于获取所述业务场景下的目标账户,将所述目标账户输入训练后的目标模型,得到所述目标账户对应的分类结果。

12、根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述分类方法。

13、根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述分类方法。

14、根据本申请实施例的一个方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行以实现上述分类方法。

15、本申请实施例提供的技术方案可以带来如下有益效果:

16、本申请实施例提供一种分类方法,该分类方法可以对与待冷启动的目标模型相关其他分类模型进行不同程度的知识蒸馏,并将蒸馏得到的知识迁移到目标模型,从而使得该目标模型在冷启动阶段可以快速进行准确分类,提升冷启动效果。

本文档来自技高网...

【技术保护点】

1.一种分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述训练数据,对所述至少两个分类模型中的每一分类模型的知识进行基于相关度的知识蒸馏,训练所述目标模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2或3所述的方法,其特征在于,所述相关度计算器通过下述方法训练得到:

5.根据权利要求3所述的方法,其特征在于,所述根据各所述分类模型对应的相关度,融合各所述分类模型的第一分类结果,得到第二分类结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述每一分类模型与所述目标模型的相关度,得到所述每一分类模型对应的第一分类结果所关联的权重,包括:

7.根据权利要求1所述的方法,其特征在于,在用户账户分类场景下,所述训练数据包括下述至少之一:

8.根据权利要求1所述的方法,其特征在于,所述至少两个分类模型不属于冷启动状态,训练前的目标模型属于冷启动状态。

9.一种分类装置,其特征在于,所述装置包括:p>

10.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至8任一项所述的分类方法。

11.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至8任一项所述的分类方法。

12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行以实现如权利要求1至8任一项所述的分类方法。

...

【技术特征摘要】

1.一种分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述训练数据,对所述至少两个分类模型中的每一分类模型的知识进行基于相关度的知识蒸馏,训练所述目标模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2或3所述的方法,其特征在于,所述相关度计算器通过下述方法训练得到:

5.根据权利要求3所述的方法,其特征在于,所述根据各所述分类模型对应的相关度,融合各所述分类模型的第一分类结果,得到第二分类结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述每一分类模型与所述目标模型的相关度,得到所述每一分类模型对应的第一分类结果所关联的权重,包括:

7.根据权利要求1所述的方法,其特征在于,在用户账户分类场景下,所述训练数据包括下述至少之一:

8.根据权利要求1所述的方法,其特征在于,所述至少两个分类模型不属...

【专利技术属性】
技术研发人员:蓝利君李岳宸汤胜龙郭清宇刘晨征欧阳天雄
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1