The invention belongs to the field of industrial large data application technology, and is specifically a method of forecasting the sales of tire enterprises based on the diversity of data and diversity of tasks. The method of the invention includes five parts: (1) the theme of feature extraction, feature extraction based on LDA model of semi structured data on the tire industry; (2) feature extraction, the tire industry enterprises according to the contact mapping related to heterogeneous network, and extract the structural features; (3) extended network structure aiming at the problem, the sparse network, through the integration of the theme and the structure features, relationship between expansion between enterprises, looking for potential related factors; (4) multi task learning method uses the LASSO method to solve the high-dimensional space shortcomings; (5) factors of feature extraction and timing analysis, through the effective integration and use of multiple sales related data set (tire demand planning, sales, OEM products tire sales data delivery etc.) prediction is verified by experimental data, can be provided The accuracy of high tire sales forecast.
【技术实现步骤摘要】
基于数据多样性和任务多样性的轮胎企业销售预测方法
本专利技术属于工业大数据应用
,具体涉及轮胎企业销售预测方法。
技术介绍
随着信息化与工业化的深度融合,信息技术渗透到了工业企业产业链的各个环节,条形码、二维码、RFID、工业传感器、工业自动控制系统、工业物联网、ERP、CAD/CAM/CAE/CAI等技术在工业企业中得到广泛应用,尤其是互联网、移动互联网、物联网等新一代信息技术在工业领域的应用,工业企业所拥有的数据也日益丰富。由工业设备所产生、采集和处理的数据量远大于企业中计算机和人工产生的数据,工业企业已经进入“大数据”时代,其数据的多样性正以创纪录的速度迅速增长。可以说,工业大数据是未来工业在全球市场竞争中发挥优势的关键。放眼全球,无论是德国工业4.0、美国工业互联网还是《中国制造2025》,各国制造业创新战略的实施基础都离不开工业大数据的搜集和特征分析。在工业4.0的时代背景下,通过深入研究未来工业的商业模式和智能服务体系的创新技术变革,以及如何通过工业大数据的分析和应用去预测需求、制造,整合产业链价值链,实现为用户提供定制化的产品和服务,这些对于工业企业都是至关重要的。自中国加入WTO以来,企业不但要与国内同行企业竞争,还要面对来自国际市场的竞争。无论是哪种类型的企业,企业的竞争力都与其产品的销量息息相关。科学准确地预测出下一个阶段产品的销量,可以帮助企业合理制定生产计划、营销策略等,帮助企业减小产品成本,回避市场风险,提高市场竞争力。随着信息化技术的高速发展,欧美发达国家正在实施以信息技术为特点的再工业化战略,中国的制造企业面临新的挑战。 ...
【技术保护点】
一种基于数据多样性和任务多样性的轮胎企业销售预测方法,其特征在于,具体步骤为:(1)提取非结构化数据的特征,即针对收集的各公司文本数据进行数据预处理,包括去噪去重,通过LDA方法得到每个公司的隐含特征;(2)提取网络数据的结构特征,即从公司报告中得到各个公司之间的关联从而构建轮胎网络,在网络中量化各个公司之间的联系强度;(3)链接扩展网络结构,综合拓扑结构和主题相似性,采用节点对之间的潜在链接强度打分算法,结合步骤(1)和步骤(2)的结果,进一步扩展优化公司之间的联系,以此有效提升轮胎销售预测的准确率;(4)整合多源数据,即在轮胎销售预测的场景下,把多种数据整合在一起;在整合中,针对特征冗余问题,引入正则化惩罚项,即特征选择;同时抽取上下游行业的价格走势数据,将其作为特征直接用于线性回归模型;(5)基于多任务的销售预测,即利用不同预测任务之间参数共享约束,将单一类型的轮胎销售预测优化为多个不同类型的轮胎销售预测问题;采用基于线性回归的轮胎销售预测方法,参数学习不仅依赖于自身的历史销售发货数据,也和其他类型轮胎的预测参数有关;此步骤将得到最后的销售预测结果。
【技术特征摘要】
1.一种基于数据多样性和任务多样性的轮胎企业销售预测方法,其特征在于,具体步骤为:(1)提取非结构化数据的特征,即针对收集的各公司文本数据进行数据预处理,包括去噪去重,通过LDA方法得到每个公司的隐含特征;(2)提取网络数据的结构特征,即从公司报告中得到各个公司之间的关联从而构建轮胎网络,在网络中量化各个公司之间的联系强度;(3)链接扩展网络结构,综合拓扑结构和主题相似性,采用节点对之间的潜在链接强度打分算法,结合步骤(1)和步骤(2)的结果,进一步扩展优化公司之间的联系,以此有效提升轮胎销售预测的准确率;(4)整合多源数据,即在轮胎销售预测的场景下,把多种数据整合在一起;在整合中,针对特征冗余问题,引入正则化惩罚项,即特征选择;同时抽取上下游行业的价格走势数据,将其作为特征直接用于线性回归模型;(5)基于多任务的销售预测,即利用不同预测任务之间参数共享约束,将单一类型的轮胎销售预测优化为多个不同类型的轮胎销售预测问题;采用基于线性回归的轮胎销售预测方法,参数学习不仅依赖于自身的历史销售发货数据,也和其他类型轮胎的预测参数有关;此步骤将得到最后的销售预测结果。2.根据权利要求1所述的轮胎企业销售预测方法,其特征在于,所述抽取非结构化数据特征的具体流程为:利用主题挖掘思想,采用文本聚类的算法,通过向量空间模型将轮胎文本里的非结构化数据映射到向量空间中的点,然后用传统的聚类算法,实现文本聚类,聚类的结果近似认为满足同一个主题;所述的主题挖掘主要用LDA模型,其生成文本的方式如下:最开始,LDA从参数为β的Dirichlet分布中抽取主题与单词的关系LDA生成一个文本时,首先从参数为α的Dirichlet分布中抽取该文本与各个主题之间的关系θ,当有K个主题时,θ是一个K维向量,其中的每个元素代表主题在文本中的出现概率,所以θ满足∑Kθ=1;接着,从参数为θ的多项式分布中抽样当前单词所属的主题z;最后从多项式分布中抽取出具体单词w;所谓参数估计,有两种思路,即EM和MCMC;其主题分布如下所示:至此,可以将轮胎行业的一些非结构化数据,包括公司主页,行业网站,工业论坛上获取的文本数据转换为公司主题向量,作为销售预测数据源的一部分,并且去除这些数据中与销售预测完全不相关的维度。3.根据权利要求1所述的轮胎企业销售预测方法,其特征在于,所述提取网络数据的结构特征的具体流程为:为了在网络中量化各个公司之间的联系强度,首先加载各公司的数据集;通过领域知识,构建轮胎异质信息网络;轮胎异质信息网络是一种特殊的信息网络,它既包含多种类型的对象,也包含多种类型的链接关系;采用PathSim方法,将不同连接路径背后所隐藏的语义信息结合到对象相似性度量问题中;两个对象之间的PathSim值定义如下:这里,p(x~→y)表示在路径P模式下,对象x和y之间的路径个数;通过这个算法,把数据集构建成了轮胎网络,为下一步的链接扩展轮胎网络结构所做的准备。4.根据权利要求1所述的轮胎企业销售预测方法,其特征在于,所述链接扩展网络结构的具体流程为:在步骤(1)和步骤(2)中,已经得到网络拓扑结构和主题向量,采用节点对之间的潜在链接强度打分算法,加载步骤(1)和步骤(2)得到的结果,综合计算相似性,进一步扩展优化公司之间的联系,从而实现数据间的互相优化训练,以有效提升轮胎销售预测的准确率;本流程采用的算法:首先定义基于主题的相似性:给定R维欧式空间中的节点x和节点y的主题特征向量θ1和θ2,从二者的特征相似性出发,定义如下式所示,表示节点x和节点y之间基于文本内容的主题相似性大小:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。