System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 评测方法、分类评测方法、排序评测方法及装置制造方法及图纸_技高网

评测方法、分类评测方法、排序评测方法及装置制造方法及图纸

技术编号:40513692 阅读:7 留言:0更新日期:2024-03-01 13:30
本说明书实施例提供评测方法、分类评测方法、排序评测方法及装置,其中评测方法包括:获取待评测任务、第一评测模型和至少两个第二评测模型,其中,待评测任务包括待评测数据和至少一个评测维度,第一评测模型的参数量大于各第二评测模型的参数量;将待评测数据和各评测维度输入第一评测模型,获得待评测数据在各评测维度对应的目标评测规则;将待评测数据和各评测维度对应的目标评测规则分别输入各第二评测模型,获得各第二评测模型输出的待评测数据在各评测维度对应的初始评测结果;将各初始评测结果输入第一评测模型,获得第一评测模型输出的待评测任务的目标评测结果。降低了模型调用成本,提高对待评测数据进行评测的准确性。

【技术实现步骤摘要】

本说明书实施例涉及人工智能,特别涉及一种评测方法、一种分类评测方法、一种排序评测方法和一种评测模型训练方法。


技术介绍

1、随着人工智能的快速发展,人工智能已经逐渐深入人们的日常生活,尤其是大模型(生成式预训练语言模型(generative pre-trained transformer))的使用在各个应用领域越来越广泛,例如,在客户服务、虚拟助手、文档分析、创意生成、智能问答等领域都应用到大模型。但随着人们使用需求的提高,对人工智能的输出结果也提出了更高的要求,基于此,在获得人工智能的输出结果后,还需要对输出结果进一步评测,评测方式可以基于大模型来实现。

2、在实际应用中,大模型调用普遍存在着调用成本高的问题,且在评测过程中所使用的评测规则通常由人工制定,存在评测规则制定成本高的问题。又由于人工制定评测规则,会使得大模型基于评测规则进行评测时,对评测规则的理解与人工制定理解不符,从而使得评测结果质量较低。

3、因此,亟需一种方法来解决上述技术问题。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种评测方法、一种分类评测方法、一种排序评测方法和一种评测模型训练方法。本说明书一个或者多个实施例同时涉及一种评测装置、一种分类评测装置、一种排序评测装置和一种评测模型训练装置,一种评测系统,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种评测方法,包括:

>3、获取待评测任务、第一评测模型和至少两个第二评测模型,其中,所述待评测任务包括待评测数据和至少一个评测维度,所述第一评测模型的参数量大于各第二评测模型的参数量;

4、将所述待评测数据和各评测维度输入所述第一评测模型,获得所述待评测数据在各评测维度对应的目标评测规则;

5、将所述待评测数据和各评测维度对应的目标评测规则分别输入各第二评测模型,获得各第二评测模型输出的所述待评测数据在各评测维度对应的初始评测结果;

6、将各初始评测结果输入所述第一评测模型,获得所述第一评测模型输出的所述待评测任务的目标评测结果。

7、根据本说明书实施例的第二方面,提供了一种评测装置,包括:

8、获取模块,被配置为获取待评测任务、第一评测模型和至少两个第二评测模型,其中,所述待评测任务包括待评测数据和至少一个评测维度,所述第一评测模型的参数量大于各第二评测模型的参数量;

9、第一输入模块,被配置为将所述待评测数据和各评测维度输入所述第一评测模型,获得所述待评测数据在各评测维度对应的目标评测规则;

10、第二输入模块,被配置为将所述待评测数据和各评测维度对应的目标评测规则分别输入各第二评测模型,获得各第二评测模型输出的所述待评测数据在各评测维度对应的初始评测结果;

11、第三输入模块,被配置为将各初始评测结果输入所述第一评测模型,获得所述第一评测模型输出的所述待评测任务的目标评测结果。

12、根据本说明书实施例的第三方面,提供了一种分类评测方法,包括:

13、获取待评测分类任务、第一评测模型和至少两个第二评测模型,其中,所述待评测分类任务包括待评测分类数据和至少一个评测维度,所述第一评测模型的参数量大于各第二评测模型的参数量;

14、将所述待评测分类数据和各评测维度输入所述第一评测模型,获得所述待评测分类数据在各评测维度对应的目标评测规则;

15、将所述待评测分类数据和各评测维度对应的目标评测规则分别输入各第二评测模型,获得各第二评测模型输出的所述待评测分类数据在各评测维度对应的初始评测结果;

16、将各初始评测结果输入所述第一评测模型,获得所述第一评测模型输出的所述待评测分类任务的目标评测结果;

17、获取预设分类阈值,并根据所述预设分类阈值和所述待评测分类任务的目标评测结果对所述待评测分类数据进行分类。

18、根据本说明书实施例的第四方面,提供了一种分类评测装置,包括:

19、分类任务获取模块,被配置为获取待评测分类任务、第一评测模型和至少两个第二评测模型,其中,所述待评测分类任务包括待评测分类数据和至少一个评测维度,所述第一评测模型的参数量大于各第二评测模型的参数量;

20、第一分类输入模块,被配置为将所述待评测分类数据和各评测维度输入所述第一评测模型,获得所述待评测分类数据在各评测维度对应的目标评测规则;

21、第二分类输入模块,被配置为将所述待评测分类数据和各评测维度对应的目标评测规则分别输入各第二评测模型,获得各第二评测模型输出的所述待评测分类数据在各评测维度对应的初始评测结果;

22、第三分类输入模块,被配置为将各初始评测结果输入所述第一评测模型,获得所述第一评测模型输出的所述待评测分类任务的目标评测结果;

23、分类模块,被配置为获取预设分类阈值,并根据所述预设分类阈值和所述待评测分类任务的目标评测结果对所述待评测分类数据进行分类。

24、根据本说明书实施例的第五方面,提供了一种排序评测方法,包括:

25、获取待评测排序任务、第一评测模型和至少两个第二评测模型,其中,所述待评测排序任务包括待评测排序数据和至少一个评测维度,所述第一评测模型的参数量大于各第二评测模型的参数量;

26、将所述待评测排序数据和各评测维度输入所述第一评测模型,获得所述待评测排序数据在各评测维度对应的目标评测规则;

27、将所述待评测排序数据和各评测维度对应的目标评测规则分别输入各第二评测模型,获得各第二评测模型输出的所述待评测排序数据在各评测维度对应的初始评测结果;

28、将各初始评测结果输入所述第一评测模型,获得所述第一评测模型输出的所述待评测排序任务的目标评测结果;

29、根据所述待评测排序任务的目标评测结果,对所述待评测排序数据进行排序。

30、根据本说明书实施例的第六方面,提供了一种排序评测装置,包括:

31、排序任务获取模块,被配置为获取待评测排序任务、第一评测模型和至少两个第二评测模型,其中,所述待评测排序任务包括待评测排序数据和至少一个评测维度,所述第一评测模型的参数量大于各第二评测模型的参数量;

32、第一排序输入模块,被配置为将所述待评测排序数据和各评测维度输入所述第一评测模型,获得所述待评测排序数据在各评测维度对应的目标评测规则;

33、第二排序输入模块,被配置为将所述待评测排序数据和各评测维度对应的目标评测规则分别输入各第二评测模型,获得各第二评测模型输出的所述待评测排序数据在各评测维度对应的初始评测结果;

34、第三排序输入模块,被配置为将各初始评测结果输入所述第一评测模型,获得所述第一评测模型输出的所述待评测排序任务的目标评测结果;

35、排序模块,被配置为根据本文档来自技高网...

【技术保护点】

1.一种评测方法,包括:

2.如权利要求1所述的方法,获得各第二评测模型输出的所述待评测数据在各评测维度对应的初始评测结果,包括:

3.如权利要求2所述的方法,候选评测结果包括候选评测意见和候选评测分值;

4.如权利要求1所述的方法,初始评测结果包括初始评测意见和初始评测分值;

5.如权利要求1所述的方法,将所述待评测数据和各评测维度输入所述第一评测模型,获得所述待评测数据在各评测维度对应的目标评测规则,包括:

6.如权利要求1所述的方法,第二评测模型的数量与所述待评测数据的评测维度存在一一对应关系;

7.如权利要求1所述的方法,第一评测模型的数量为至少两个;

8.如权利要求7所述的方法,将各初始评测结果输入所述第一评测模型,获得所述第一评测模型输出的所述待评测任务的目标评测结果,包括:

9.一种分类评测方法,包括:

10.一种排序评测方法,包括:

11.一种评测模型训练方法,应用于云侧设备,包括:

12.一种评测系统,包括第一评测模型和至少两个第二评测模型;

13.一种评测装置,包括:

14.一种计算设备,包括:

15.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述方法的步骤。

...

【技术特征摘要】

1.一种评测方法,包括:

2.如权利要求1所述的方法,获得各第二评测模型输出的所述待评测数据在各评测维度对应的初始评测结果,包括:

3.如权利要求2所述的方法,候选评测结果包括候选评测意见和候选评测分值;

4.如权利要求1所述的方法,初始评测结果包括初始评测意见和初始评测分值;

5.如权利要求1所述的方法,将所述待评测数据和各评测维度输入所述第一评测模型,获得所述待评测数据在各评测维度对应的目标评测规则,包括:

6.如权利要求1所述的方法,第二评测模型的数量与所述待评测数据的评测维度存在一一对应关系;

7.如权利要求1所述的方法,第一评测...

【专利技术属性】
技术研发人员:关新宇郁博文余海洋李永彬黄非
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1