一种基于多模型的供应链数据预测方法及装置制造方法及图纸

技术编号:38156443 阅读:11 留言:0更新日期:2023-07-13 09:25
本说明书实施例提供一种基于多模型的供应链数据预测方法,在训练阶段,将离线的供应链数据集切分为多批离线样本,然后分别基于该多批离线样本,训练不同的机器学习模型,得到多个预测模型。在预测阶段,先将在线的供应链数据集切分为多批在线样本。然后针对每批在线样本,从多批离线样本中确定出与其最相似的一批离线样本,并利用对应于该批离线样本的目标预测模型,针对该批在线样本进行预测,得到其中的各个在线样本的预测结果。由此,可以有效地解决数据漂移问题,进而可以提高数据预测的准确率。准确率。准确率。

【技术实现步骤摘要】
一种基于多模型的供应链数据预测方法及装置


[0001]本说明书一个或多个实施例涉及机器学习领域,尤其涉及一种基于多模型的供应链数据预测方法及装置。

技术介绍

[0002]大型供应链集成服务企业集团在推进数字化转型赋能管理提升、业务发展的过程中,需要建设供应链大数据中心,并结合实际的管理或业务应用场景,采用大数据及人工智能算法,构建相应的供应链数据模型(以下简称数据模型),挖掘数据背后隐藏的价值为企业管理提升、业务发展赋能。从目前的发展趋势来看,数据模型对机器学习(machine learning,ML)技术的依赖度越来越高。然而,这些数据模型很容易受到数据漂移问题(如数据源的变化、采样偏差、环境变化等)的影响,当这些因素改变了数据的特征分布时,即过去的训练数据和未来的预测数据不匹配,数据模型可能无法适应新的数据分布,从而导致模型性能下降、预测偏差增加、数据实效、模型泛化能力降低、预测稳定性降低,从而给数据价值挖掘带来严重的后果。例如,构建跨企业多供应链环节异常分析模型的过程中发现,在测试数据上的模型验证效果较好,但在实际上线部署以后模型的效果会快速下降。经过分析后发现,由于库存异动、物流中断、船只压港、超载超限、疲劳驾驶及运输路线等供应链环节不断了产生新的变化,从而出现了新的异常情况。也就是说,如果继续采用以前的分析方法来识别新的供应链异常情况,供应链环节异常分析的结果通常是不准确的。
[0003]针对数据漂移的问题,现存的解决方案,要么通过重新训练的方法,要么通过对训练样本进行加权的方法来解决数据漂移的问题。然而,这些方法准确率低,不能解决数据化转型实践过程中存在的问题。

技术实现思路

[0004]本说明书一个或多个实施例描述了一种基于多模型的供应链数据预测方法及装置,可以消除数据漂移,从而可以提高数据预测的准确率。
[0005]第一方面,提供了一种基于多模型的供应链数据预测方法,所述多模型包括树模型和多个预测模型,其中,所述树模型基于离线的供应链数据集训练得到,所述多个预测模型分别基于针对所述离线的供应链数据集切分的多批离线样本,训练不同的机器学习模型而得到;所述方法包括:获取在线的供应链数据集,并将其切分为多批在线样本;针对所述多批在线样本中任意的第p批在线样本,将其输入所述树模型,并统计落入所述树模型的各个叶子节点的在线样本数目;从所述各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询所述目标叶子节点所对应行中的各目标矩阵元素;所述目标矩阵的一行对应于一个叶子节点,一列对应于一个批次的离线样本,且其中第i行第j列的矩阵元素,表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目;
根据所述各目标矩阵元素中最大的目标矩阵元素所在列,从所述多批离线样本中确定出目标批次的离线样本;将所述第p批在线样本,输入所述多个预测模型中对应于所述目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果;至少基于所述各个在线样本的第一预测结果,确定所述各个在线样本的最终预测结果。
[0006]第二方面,提供了一种基于多模型的供应链数据预测装置,所述多模型包括树模型和多个预测模型,其中,所述树模型基于离线的供应链数据集训练得到,所述多个预测模型分别基于针对所述离线的供应链数据集切分的多批离线样本,训练不同的机器学习模型而得到;所述装置包括:获取单元,用于获取在线的供应链数据集,并将其切分为多批在线样本;统计单元,用于针对所述多批在线样本中任意的第p批在线样本,将其输入所述树模型,并统计落入所述树模型的各个叶子节点的在线样本数目;查询单元,用于从所述各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询所述目标叶子节点所对应行中的各目标矩阵元素;所述目标矩阵的一行对应于一个叶子节点,一列对应于一个批次的离线样本,且其中第i行第j列的矩阵元素,表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目;确定单元,用于根据所述各目标矩阵元素中最大的目标矩阵元素所在列,从所述多批离线样本中确定出目标批次的离线样本;输入单元,用于将所述第p批在线样本,输入所述多个预测模型中对应于所述目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果;所述确定单元,还用于至少基于所述各个在线样本的第一预测结果,确定所述各个在线样本的最终预测结果。
[0007]本说明书一个或多个实施例提供的基于多模型的供应链数据预测方法及装置,在训练阶段,将离线的供应链数据集切分为多批离线样本,然后分别基于该多批离线样本,训练不同的机器学习模型,得到多个预测模型。在预测阶段,先将在线的供应链数据集切分为多批在线样本。然后针对每批在线样本,从多批离线样本中确定出与其最相似的一批离线样本,并利用对应于该批离线样本的目标预测模型,针对该批在线样本进行预测,得到其中的各个在线样本的预测结果;如此得到在线的供应链数据集中各个供应链数据的预测结果。由此,可以有效地解决数据漂移问题,进而可以提高数据预测的准确率。
附图说明
[0008]为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0009]图1为本说明书披露的一个实施例的实施场景示意图;图2示出根据一个实施例的模型训练方法流程图;
图3示出根据一个实施例的一种基于多模型的供应链数据预测方法流程图;图4示出根据一个实施例的一种基于多模型的供应链数据预测装置示意图。
具体实施方式
[0010]下面结合附图,对本说明书提供的方案进行描述。
[0011]图1为本说明书披露的一个实施例的实施场景示意图。图1中,多批训练装置和在线推理装置组成预测系统,该预测系统用于针对供应链数据进行预测。
[0012]具体地,可以先获取离线的供应链数据集,并将其切分为多批离线样本。之后,可以将该多批离线样本输入多批训练装置,以利用该多批训练装置,分别基于该多批离线样本训练多个预测模型。
[0013]之后,可以获取在线的供应链数据集,并将其切分为多批在线样本,以及将该多批在线样本输入在线推理装置,以利用该在线推理装置,针对每批在线样本,从多批离线样本中确定出与其最相似的一批离线样本,并利用对应于该批离线样本的目标预测模型,针对该批在线样本进行预测,得到其中的各个在线样本的预测结果;如此得到在线的供应链数据集中各个供应链数据的预测结果。
[0014]本方案中可以通过两种搜索方法针对每批离线样本,搜索与其最相似的一批离线样本,后续对此进行详细说明。
[0015]总之,通过上述预测系统中的多批训练装置,可以对离线的供应链数据集进行切分,且分别基于切分的各个离线子集,可以训练得到多个预测模型,以便于后续在针对在线的供应链数据集进行预测时进行匹配选择。上述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多模型的供应链数据预测方法,所述多模型包括树模型和多个预测模型,其中,所述树模型基于离线的供应链数据集训练得到,所述多个预测模型分别基于针对所述离线的供应链数据集切分的多批离线样本,训练不同的机器学习模型而得到;所述方法包括:获取在线的供应链数据集,并将其切分为多批在线样本;针对所述多批在线样本中任意的第p批在线样本,将其输入所述树模型,并统计落入所述树模型的各个叶子节点的在线样本数目;p为正整数;从所述各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询所述目标叶子节点所对应行中的各目标矩阵元素;所述目标矩阵的一行对应于一个叶子节点,一列对应于一个批次的离线样本,且其中第i行第j列的矩阵元素,表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目;其中,i和j均为正整数;根据所述各目标矩阵元素中最大的目标矩阵元素所在列,从所述多批离线样本中确定出目标批次的离线样本;将所述第p批在线样本,输入所述多个预测模型中对应于所述目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果;至少基于所述各个在线样本的第一预测结果,确定所述各个在线样本的最终预测结果。2.根据权利要求1所述的方法,还包括:对于所述第p批在线样本,基于所述多个预测模型分别针对其中的各抽样在线样本的预测结果以及抽样样本数目,计算对应于所述多个预测模型的多个分数;从所述多个预测模型中选取对应于最大分数的第二目标预测模型,并将所述第p批在线样本输入所述第二目标预测模型,得到其中的各个在线样本的第二预测结果;所述确定所述各个在线样本的最终预测结果,包括:分别对所述第p批在线样本中各个在线样本各自的第一预测结果和第二预测结果进行融合,得到所述各个在线样本的最终预测结果。3.根据权利要求2所述的方法,其中,所述多个预测模型包括第一预测模型;所述计算对应于所述多个预测模型的多个分数,包括:对第一预定数值与所述第一预测模型针对任一抽样在线样本的预测结果求差后再求平方,得到对应于该抽样在线样本的求平方结果;对对应于所述各抽样在线样本的各求平方结果求平均,得到求平均结果;将第二预定数值与所述求平均结果的差值,确定为对应于所述第一预测模型的第一分数。4.根据权利要求1所述的方法,其中,所述获取在线的供应链数据集,并将其切分为多批在线样本,包括:获取在线的供应链数据集,并按照时间维度,将其切分为多批在线样本,使得各批在线样本分别对应于不同的时间段。5.根据权利要求1所述的方法,其中,所述不同的机器学习模型包括逻辑回归模型、深度学习模型以及树模型中的若干项。
6.根据权利要求1所述的方法,其中,所述目标矩阵中任意的第一矩阵元素的行号与该第一矩阵元素所在行对应的叶子节点的节点编号相一致,以及该第一矩阵元素的列号与该第一矩阵元素所在列对应的一个批次的离线样本的批次号相一致。7.根据权利要求6所述的方法,其中,所述从目标矩阵中查询所述目标叶子节点...

【专利技术属性】
技术研发人员:朱海洋周俊陈为肖杰胡健季永炜郑励陈晓丰童高强
申请(专利权)人:物产中大数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1