模型评估方法、装置、终端及存储介质制造方法及图纸

技术编号：38476441 阅读：11 留言：0更新日期：2023-08-15 16:56

本申请公开了一种模型评估方法、装置、终端及存储介质，方法包括：复制线上流量；将线上流量同时输入目标实验模型和目标基线模型，输出指标结果，其中，目标实验模型和目标基线模型均设置于旁路环境中；根据指标结果，评估目标实验模型和目标基线模型的差异性。本发明专利技术直接复制线上流量，无需采用真实的线上流量，降低了线上流量的损耗，此外，将目标实验模型和目标基线模型均设置于旁路环境中，不需要完整的上线流程以及等待用户的反馈结果，降低了评估目标实验模型和目标基线模型的差异性的周期，提高了评估效率。提高了评估效率。提高了评估效率。

全部详细技术资料下载

【技术实现步骤摘要】
模型评估方法、装置、终端及存储介质

[0001]本申请涉及计算机
，具体而言，涉及一种模型评估方法、装置、终端及存储介质。

技术介绍

[0002]在很多应用场景下，如音乐推荐场景下需要使用实验模型来预测所要推荐的歌曲。因此，评估实验模型是否可以使用，也就是有没有必要上线十分重要。
[0003]目前，一般通过线上环境来评估实验模型和基线模型的差异性，进而判断实验模型是否有必要上线。具体的，先将实验模型和基线模型上线，然后分别给实验模型和基线模型分配一股真实的线上流量进行预测，再将实验模型和基线模型预测后的结果进行比较，并根据比较结果来判断实验模型是否有必要上线。
[0004]但是，上述方法不仅需要采用真实的线上流量，还需要完整的实验上线流程以及等待用户的反馈结果，导致评估实验模型和基线模型的差异性周期长。

技术实现思路

[0005]本申请的主要目的在于提供一种模型评估方法、装置、终端及存储介质，以解决相关技术中评估实验模型和基线模型的差异性周期长的问题。
[0006]为了实现上述目的，第一方面，本申请提供了一种模型评估方法，包括：
[0007]复制线上流量；
[0008]将线上流量同时输入目标实验模型和目标基线模型，输出指标结果，其中，目标实验模型和目标基线模型均设置于旁路环境中；
[0009]根据指标结果，评估目标实验模型和目标基线模型的差异性。
[0010]在一种可能的实现方式中，根据指标结果，评估目标实验模型和目标基线模型的差异性，包括...

【技术保护点】

【技术特征摘要】
1.一种模型评估方法，其特征在于，包括：复制线上流量；将所述线上流量同时输入目标实验模型和目标基线模型，输出指标结果，其中，所述目标实验模型和目标基线模型均设置于旁路环境中；根据所述指标结果，评估所述目标实验模型和目标基线模型的差异性。2.如权利要求1所述模型评估方法，其特征在于，所述根据所述指标结果，评估所述目标实验模型和目标基线模型的差异性，包括：对所述指标数据进行处理，得到所述指标数据对应的输出数据；基于所述输出数据和预设条件，评估所述目标实验模型和目标基线模型的差异性。3.如权利要求2所述模型评估方法，其特征在于，所述对所述指标数据进行处理，得到所述指标数据对应的输出数据，包括：利用Flink任务对所述指标数据进行展开处理，得到所述指标数据对应的数据表；利用Spark任务对所述数据表中的数据进行配置、计算处理，得到所述输出数据。4.如权利要求3所述模型评估方法，其特征在于，所述利用Flink任务对所述指标数据进行展开处理，得到所述指标数据对应的数据表，包括：读取所述指标结果；对所述指标结果按照字段维度展开，形成所述指标结果对应的数据表。5.如权利要求3所述模型评估方法，其特征在于，所述利用Spark任务对所述数据表中的数据进行配置、计算处理，得到所述输出数据，包括：提取配置文件；读取所述数据表中的数据，并利用所述配置文件中的输入配置对所述数据表中数据进行配置，得到输入数据；利用所述配置文件中的策略算子的计算方式对所述输入数据进行计算处理，得到所述输出数据。6.如权利要求5所述模型评估方法，其特征在于，所述利用所述配置文件中的策略算子的计算方式对所述输入数据进行计算处理，得到所述输出数据，包括：在所述策略算子的计算方式为混淆矩阵的情况下，将所述输入数据中的目标实验模型和目...

【专利技术属性】
技术研发人员：陈赢，李雪冬，黄崛，谭钧心，骆庚，吴官林，
申请(专利权)人：杭州网易云音乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人