【技术实现步骤摘要】
用于稀疏时间序列数据集的数据插补的方法和装置
[0001]相关申请的交叉引用
[0002]本申请要求于2021年8月24日提交的印度临时专利申请202141038261的优先权,上述优先权申请的全部内容通过引用并入本文。
[0003]本公开总体上涉及用于具有稀疏度的数据资产的数据插补的装置和方法。
技术介绍
[0004]资源的分配对于组织的生存能力和利润产生是重要的。在电子商务环境中,诸如人员之类的资源的分配会极大地影响零售业务的效率,以及顾客对零售业务的体验。例如,在顾客下订单之后,顾客必须等待接收订单或使项(item)可拾取的时间越长,顾客的体验变得负面的机会就越大。在各种示例中,零售企业分配资源的能力可以取决于零售企业预测由零售企业提供的产品的需求的能力。然而,需求预测仅与需求预测所基于的数据一样好。在许多情况下,用于预测需求的数据可能具有稀疏度或具有缺失值。具有高稀疏水平的数据可能是由于次优的手动数据收集过程或自动数据收集系统中的技术故障所致。这种数据稀疏性可能显著地损害下游需求预测应用的性能。 />[0005]在各本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种系统,包括:一个或多个处理器;以及存储器资源,存储指令,所述指令在由所述一个或多个处理器执行时使所述一个或多个处理器:获得第一时间序列数据集,所述第一时间序列数据集包括多个数据元素,每个数据元素包括值数据和对应的时间数据;基于所述第一时间序列数据集,生成第二数据集和第三数据集,所述第二数据集指示所述多个数据元素中的缺失值数据的一个或多个数据元素,所述第三数据集包括指示针对所述多个数据元素中的每个数据元素的极值得分的极值数据;以及基于所述第一时间序列数据集、所述第二数据集和所述第三数据集,实现针对所述一个或多个数据元素中的、缺失值数据的每个数据元素来生成替代值数据的操作集。2.根据权利要求1所述的系统,其中所述一个或多个处理器执行所述指令以进一步:对于所述多个数据元素中的缺失值数据的每个数据元素,利用对应的所述替代值数据来替换所述数据元素。3.根据权利要求1所述的系统,其中实现所述操作集包括利用递归神经网络(RNN)。4.根据权利要求3所述的系统,其中所述RNN可以包括两个单独的双向长短期存储器网络。5.根据权利要求1所述的系统,其中针对所述一个或多个数据元素中的、缺失值数据的每个数据元素生成所述替代值数据的所述操作集包括:在前向层中,基于所述第一时间序列数据集和所述第三数据集来确定第一预测输出值集和第一预测极值得分集。6.根据权利要求5所述的系统,其中所述第一时间序列数据集的所述多个数据元素至少包括第一数据元素和第二数据元素,并且所述第三数据集的所述极值数据至少包括与所述第一数据元素相关联的第一极值值和与所述第二数据元素相关联的第二极值值。7.根据权利要求6所述的系统,其中确定所述第一预测输出值集和所述第一预测极值得分集包括:基于所述第一数据元素和所述第一极值值,确定针对缺失值数据的至少一个数据元素的第一预测输出值、以及针对缺失值数据的所述至少一个数据元素的对应的第一预测极值值。8.根据权利要求7所述的系统,其中确定所述第一预测输出值集和所述第一预测极值得分集还包括:基于所述第一预测输出值和对应的所述第一预测极值值,确定针对缺失值数据的至少另一数据元素的第二预测输出值和对应的第二预测极值值。9.根据权利要求5所述的系统,其中针对所述一个或多个数据元素中的、缺失值数据的每个数据元素生成所述替代值数据的所述操作集包括:在后向层中,基于所述第一时间序列数据集和所述第三数据集来确定第二预测输出值集和第二预测极值得分集。10.根据权利要求9所述的系统,其中针对所述一个或多个数据元素中的、缺失值数据的每个数据元素生成所述替代值数据的所述操作集还包括:
至少基于所述第一预测输出值集、所述第一预测极值得分集、所述第二预测输出值集和所述第二预测极值得分集,来生成差异数据。11.一种计算机实现的方法,包括:获得第一时间序列数据集,所述第一时间序列数据集包括多个数据元素,每个数据元素包括值数据和对应的时间数据;基于所述第一时间序列数据集,生成第二数据集和第三数据集,所述第二数据集...
【专利技术属性】
技术研发人员:A,
申请(专利权)人:沃尔玛阿波罗有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。