【技术实现步骤摘要】
一种基于误差
‑
模糊度分解的集成学习需求预测方法
[0001]本专利技术涉及机器学习的数据驱动决策
,更具体的说是涉及一种基于误差
‑
模糊度分解的集成学习需求预测方法。
技术介绍
[0002]预测,是大数据时代的重要课题。随着大数据、数字经济的兴起,数据在商业运营和决策中发挥了更加重要的作用,管理决策越来越倾向于借助数据和数据分析。由此,近年来兴起数据驱动决策的热潮,并且已经开始在实践中产生了巨大的经济效益。预测是数据驱动决策的重要方向,借助大量的、高维的数据进行预测,可以为科学决策提供基础和支撑。例如,需求预测已经成为新零售等商业模式变革下产品运营和供应链管理的重要工作内容。
[0003]现实场景中存在大量高特征维度、小样本量的预测任务。针对这类任务,采用集成学习具有两大优点:(1)通过特征抽样对单个基学习器进行降维,减少过拟合;(2)通过多个基学习器的集成,提高预测结果的稳定性。要得到泛化性能强的集成,基学习器之间应尽可能存在较大差异。然而,为了获得好的集成效果,基学习器的性能不能太差。也就是说,由于抽样的随机性,往往难以兼顾“准确性”和“多样性”,即“好而不同”的基学习器难以获得。
[0004]基于以上背景,如何考虑采用有交叠的采样子集,设计一种能够更好地兼顾“好”和“不同”的集成学习预测方法是本领域技术人员亟需解决的技术问题。
技术实现思路
[0005]有鉴于此,本专利技术提供了一种基于误差
‑
模糊度分解的集成学习需求 ...
【技术保护点】
【技术特征摘要】
1.一种基于误差
‑
模糊度分解的集成学习需求预测方法,其特征在于,包括以下步骤:S1、提取每个产品的属性特征集,记为AF
i
;S2、基于属性特征集AF
i
对所有产品进行聚类,得到相似产品组成的产品簇;S3、提取产品i的预测目标数据和预测特征,构造初始预测特征集OF
i
;S4、对每一个待预测产品的初始预测特征集OF
i
进行特征筛选,得到产品级重要特征集IMF
i
和产品级特征重要性标记L
i
,其中保留的特征标记为1,被剔除的特征标记为0;S5、将同一簇内产品对应的初始预测特征集OF
i
合并,构建簇内预测数据集并进行筛选,得到簇级重要特征集和簇级特征重要性标记其中,CL
i
表示产品i所在的簇;S6、对于每个产品,将自身的产品级重要特征和簇级重要特征合并,构建综合重要特征集S7、对产品级特征重要性标记L
i
和簇级特征重要性标记进行加权平均,计算综合重要特征集中每个特征的重要度并进行排序;S8、根据排序结果,选取头部的特征作为锚定特征,从剔除锚定特征后的综合重要特征集中有放回地随机抽取其他特征作为模糊特征,将锚定特征和模糊特征合并作为一个特征组合;S9、将多个特征组合分别输入机器学习模型训练基学习器,直至损失函数收敛,利用得到的基学习器预测需求;S10、将多个基学习器的预测结果集成,得到最终的需求预测结果。2.根据权利要求1所述的一种基于误差
‑
模糊度分解的集成学习需求预测方法,其特征在于,S1中,产品属性特征包括:产地、品牌、材质、工艺、规格、类目、功能参数、价位、渠道特性、社会属性、使用寿命、消费速度、相对价格水平、市场表现特征。3.根据权利要求1所述的一种基于误差
‑
模糊度分解的集成学习需求预测方法,其特征在于,S2中,对所有产品进行聚类的方法包括:划分法、层次法、密度算法、图论聚类法、网格算法、模型算法。4.根据权利要求1所述的一种基于误差
‑
模糊度分解的集成学习需求预测方法,其特征在于,S4中,对每一个待预测产品的初始预测特征集OF
i<...
【专利技术属性】
技术研发人员:周云,王明征,赵健亦,黄小鹏,颜炅,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。