当前位置: 首页 > 专利查询>复旦大学专利>正文

基于数据多样性和任务多样性的轮胎企业销售预测方法技术

技术编号:16885896 阅读:67 留言:0更新日期:2017-12-27 03:41
本发明专利技术属于工业大数据应用技术领域,具体为一种基于数据多样性和任务多样性的轮胎企业销售预测方法。本发明专利技术方法包括五个部分:(1)主题特征提取,通过LDA模型提取关于轮胎行业的半结构化数据的特征;(2)结构特征提取,通过将轮胎行业的企业根据相关的联系映射到异质网络中,并提取出结构特征;(3)网络结构扩展,针对网络稀疏性问题,通过融合主题特征和结构特征,扩展企业之间的关系图,寻找潜在关联因素;(4)使用LASSO方法的多任务学习方法来解决高维样本空间的缺点;(5)因素特征提取与时序分析,通过有效整合和利用与销售相关的多个数据集(轮胎需求计划,主机厂产品销量,轮胎销售发货数据等)进行预测,通过实验数据验证,能够提高轮胎销售预测的准确率。

Sales prediction method of tire enterprises based on data diversity and task diversity

The invention belongs to the field of industrial large data application technology, and is specifically a method of forecasting the sales of tire enterprises based on the diversity of data and diversity of tasks. The method of the invention includes five parts: (1) the theme of feature extraction, feature extraction based on LDA model of semi structured data on the tire industry; (2) feature extraction, the tire industry enterprises according to the contact mapping related to heterogeneous network, and extract the structural features; (3) extended network structure aiming at the problem, the sparse network, through the integration of the theme and the structure features, relationship between expansion between enterprises, looking for potential related factors; (4) multi task learning method uses the LASSO method to solve the high-dimensional space shortcomings; (5) factors of feature extraction and timing analysis, through the effective integration and use of multiple sales related data set (tire demand planning, sales, OEM products tire sales data delivery etc.) prediction is verified by experimental data, can be provided The accuracy of high tire sales forecast.

【技术实现步骤摘要】
基于数据多样性和任务多样性的轮胎企业销售预测方法
本专利技术属于工业大数据应用
,具体涉及轮胎企业销售预测方法。
技术介绍
随着信息化与工业化的深度融合,信息技术渗透到了工业企业产业链的各个环节,条形码、二维码、RFID、工业传感器、工业自动控制系统、工业物联网、ERP、CAD/CAM/CAE/CAI等技术在工业企业中得到广泛应用,尤其是互联网、移动互联网、物联网等新一代信息技术在工业领域的应用,工业企业所拥有的数据也日益丰富。由工业设备所产生、采集和处理的数据量远大于企业中计算机和人工产生的数据,工业企业已经进入“大数据”时代,其数据的多样性正以创纪录的速度迅速增长。可以说,工业大数据是未来工业在全球市场竞争中发挥优势的关键。放眼全球,无论是德国工业4.0、美国工业互联网还是《中国制造2025》,各国制造业创新战略的实施基础都离不开工业大数据的搜集和特征分析。在工业4.0的时代背景下,通过深入研究未来工业的商业模式和智能服务体系的创新技术变革,以及如何通过工业大数据的分析和应用去预测需求、制造,整合产业链价值链,实现为用户提供定制化的产品和服务,这些对于工业企业都是至关重要的。自中国加入WTO以来,企业不但要与国内同行企业竞争,还要面对来自国际市场的竞争。无论是哪种类型的企业,企业的竞争力都与其产品的销量息息相关。科学准确地预测出下一个阶段产品的销量,可以帮助企业合理制定生产计划、营销策略等,帮助企业减小产品成本,回避市场风险,提高市场竞争力。随着信息化技术的高速发展,欧美发达国家正在实施以信息技术为特点的再工业化战略,中国的制造企业面临新的挑战。当前轮胎产业正面临转型升级的关键时刻,产能过剩问题普遍存在,因此对于销量的预测显得更加重要。合理科学的预测依赖于相关信息,而信息的载体是数据,决策依靠数据。与互联网行业数据相比,轮胎行业的数据具有价值密度高、数据类型丰富、来源多样性等特点。轮胎的成本受到诸多因素影响,橡胶、硫、钢等原材料价格都会影响轮胎市场,同时轮胎产品的销量与贸易保护出口限制政策、汽车产量、宏观经济数据的关联性强。从这些角度来看,轮胎销量的预测充满挑战。国内轮胎企业主要分为海外市场和国内市场,海外市场主要按客户订单生产,海外客户信誉良好,无需进行销售预测和库存备货工厂,按订单生产即可,企业海外市场的生产计划准确率一般在80%-90%以上。轮胎企业国内生产计划编制,每月中下旬由各地销售员上报下月的销售数据,预估轮胎产品下月生产计划,并在月底进行下月拟销售数量和生产数量的修改确认,最终由计划部门编制工厂所有产品型号的下月销售计划和生产计划。由于汽车和工程机械等主机厂上报轮胎需求数量形成预估生产值依赖于主机厂生产的稳定性以及轮胎公司销售员的个人经验,针对国内主机厂配套部的轮胎销售计划准确率一般为60%-70%,导致企业生产计划的频繁变动和大量库存的存在。对于轮胎的零售批发市场,一级经销商的需求估计则受市场变动的影响巨大,依赖经验估计的需求量与真实订单间差异较大,轮胎零售批发市场的销售计划准确率低于50%,需要进行合理的产品备库。轮胎的销量受多种复杂因素的共同作用影响,如何有效地预测轮胎销量是一个挑战。然而,在大数据时代,数据的积累已经达到了一定程度,使有效整合和利用与销售相关的多个数据集成为可能。本专利技术通过精确的特征提取与选取恰当的算法,为企业提供了轮胎销售预测的方法,并且通过实验证明能够有效提升轮胎销售预测的准确度。
技术实现思路
本专利技术的目的在于提供一种预测准确度高,使用操作方便的轮胎企业销售预测的方法。本专利技术提供的轮胎企业销售预测的方法,包括:通过LDA模型(LatentDirichletAllocation)提取关于轮胎行业的半结构化数据的特征,来实现主题特征的提取;通过将轮胎行业的企业更具相关的联系映射到异质网络中来进行结构特征提取;针对网络稀疏性问题,通过融合主题特征和结构特征,扩展企业之间的关系图,达到了网络结构扩展的目的。本方法使用LASSO(TheLeastAbsoluteShrinkageandSelectionatorOperator)方法的多任务学习方法来解决高维样本空间的缺点。此外,因素特征提取是通过有效整合和利用与销售相关的多个数据集来实现的,最后采用基于线性回归的整合算法进行轮胎销售数据预测。通过实验数据验证,企业下月轮胎销售计划的预测准确率由70%提高到使用本预测方法的78%,能够提高轮胎销售数据预测的准确率。该方法所涉及的概念主要包括非结构化数据特征抽取,构建网络,网络扩展,特征融合,时序分析等。本专利技术提出的对轮胎企业进行销售预测的具体方法和具体步骤为:(1)提取非结构化数据的特征,即针对收集的各公司文本数据进行数据预处理(去噪去重),通过LDA方法得到每个公司的隐含特征,通过此过程拓展数据源;(2)提取网络数据的结构特征,从公司报告中得到各个公司之间的关联从而构建轮胎网络,在网络中量化各个公司之间的联系强度;(3)链接扩展网络结构,综合拓扑结构和主题相似性,采用节点对之间的潜在链接强度打分算法,结合步骤(1)和步骤(2)的结果,进一步扩展优化公司之间的联系,以此有效提升轮胎销售预测的准确率;(4)整合多源数据,在轮胎销售预测的场景下,把多种数据整合在一起。在整合中,针对特征冗余问题(特征维度大于训练样本个数),引入正则化惩罚项,即特征选择。同时抽取上下游行业的价格走势数据,在此处将其作为特征直接用于线性回归模型;(5)基于多任务的销售预测,即利用不同预测任务之间参数共享约束(sharedparameter),将单一类型的轮胎销售预测优化为多个不同类型的轮胎销售预测问题。在基于线性回归的轮胎销售预测中,参数学习不仅依赖于自身的历史数据,也和其他类型轮胎的预测参数有关。此步骤将得到最后的销售预测结果。所述抽取非结构化数据特征的具体流程为:本流程核心思路是利用主题挖掘思想,采用文本聚类的算法,通过向量空间模型将轮胎文本里的非结构化数据映射到向量空间中的点,然后用传统的聚类算法,实现文本聚类,聚类的结果可以近似认为满足同一个主题。经过这个流程的处理,这些非结构化数据不仅做了预处理过滤,还能丰富轮胎销售预测的数据源。本流程的主题挖掘主要用了LDA模型,其生成文本的方式参见图1所示。最开始,LDA从参数为β的Dirichlet分布中抽取主题与单词的关系LDA生成一个文本时,首先从参数为α的Dirichlet分布中抽取该文本与各个主题之间的关系θ,当有K个主题时,θ是一个K维向量,其中的每个元素代表主题在文本中的出现概率,所以θ满足∑Kθ=1;接着,从参数为θ的多项式分布中抽样当前单词所属的主题k;最后从参数为的多项式分布中抽取出具体单词w。所谓参数估计,有两种思路,即EM和MCMC。其主题分布如下所示:ni,k表示在若干次重复实验中,主题k在所有主题中出现的次数;为词语的多项式分布,w为采样最终生成词语。至此,我们可以将轮胎行业的一些非结构化数据,如公司主页,行业网站,工业论坛上获取的文本数据转换为公司主题向量,作为销售预测数据源的一部分,并且去除了这些数据中与销售预测完全不相关的维度,比如轮胎企业开展的各项内部活动演出显然不是轮胎销售预测需要考虑的因素,这本文档来自技高网
...
基于数据多样性和任务多样性的轮胎企业销售预测方法

【技术保护点】
一种基于数据多样性和任务多样性的轮胎企业销售预测方法,其特征在于,具体步骤为:(1)提取非结构化数据的特征,即针对收集的各公司文本数据进行数据预处理,包括去噪去重,通过LDA方法得到每个公司的隐含特征;(2)提取网络数据的结构特征,即从公司报告中得到各个公司之间的关联从而构建轮胎网络,在网络中量化各个公司之间的联系强度;(3)链接扩展网络结构,综合拓扑结构和主题相似性,采用节点对之间的潜在链接强度打分算法,结合步骤(1)和步骤(2)的结果,进一步扩展优化公司之间的联系,以此有效提升轮胎销售预测的准确率;(4)整合多源数据,即在轮胎销售预测的场景下,把多种数据整合在一起;在整合中,针对特征冗余问题,引入正则化惩罚项,即特征选择;同时抽取上下游行业的价格走势数据,将其作为特征直接用于线性回归模型;(5)基于多任务的销售预测,即利用不同预测任务之间参数共享约束,将单一类型的轮胎销售预测优化为多个不同类型的轮胎销售预测问题;采用基于线性回归的轮胎销售预测方法,参数学习不仅依赖于自身的历史销售发货数据,也和其他类型轮胎的预测参数有关;此步骤将得到最后的销售预测结果。

【技术特征摘要】
1.一种基于数据多样性和任务多样性的轮胎企业销售预测方法,其特征在于,具体步骤为:(1)提取非结构化数据的特征,即针对收集的各公司文本数据进行数据预处理,包括去噪去重,通过LDA方法得到每个公司的隐含特征;(2)提取网络数据的结构特征,即从公司报告中得到各个公司之间的关联从而构建轮胎网络,在网络中量化各个公司之间的联系强度;(3)链接扩展网络结构,综合拓扑结构和主题相似性,采用节点对之间的潜在链接强度打分算法,结合步骤(1)和步骤(2)的结果,进一步扩展优化公司之间的联系,以此有效提升轮胎销售预测的准确率;(4)整合多源数据,即在轮胎销售预测的场景下,把多种数据整合在一起;在整合中,针对特征冗余问题,引入正则化惩罚项,即特征选择;同时抽取上下游行业的价格走势数据,将其作为特征直接用于线性回归模型;(5)基于多任务的销售预测,即利用不同预测任务之间参数共享约束,将单一类型的轮胎销售预测优化为多个不同类型的轮胎销售预测问题;采用基于线性回归的轮胎销售预测方法,参数学习不仅依赖于自身的历史销售发货数据,也和其他类型轮胎的预测参数有关;此步骤将得到最后的销售预测结果。2.根据权利要求1所述的轮胎企业销售预测方法,其特征在于,所述抽取非结构化数据特征的具体流程为:利用主题挖掘思想,采用文本聚类的算法,通过向量空间模型将轮胎文本里的非结构化数据映射到向量空间中的点,然后用传统的聚类算法,实现文本聚类,聚类的结果近似认为满足同一个主题;所述的主题挖掘主要用LDA模型,其生成文本的方式如下:最开始,LDA从参数为β的Dirichlet分布中抽取主题与单词的关系LDA生成一个文本时,首先从参数为α的Dirichlet分布中抽取该文本与各个主题之间的关系θ,当有K个主题时,θ是一个K维向量,其中的每个元素代表主题在文本中的出现概率,所以θ满足∑Kθ=1;接着,从参数为θ的多项式分布中抽样当前单词所属的主题z;最后从多项式分布中抽取出具体单词w;所谓参数估计,有两种思路,即EM和MCMC;其主题分布如下所示:至此,可以将轮胎行业的一些非结构化数据,包括公司主页,行业网站,工业论坛上获取的文本数据转换为公司主题向量,作为销售预测数据源的一部分,并且去除这些数据中与销售预测完全不相关的维度。3.根据权利要求1所述的轮胎企业销售预测方法,其特征在于,所述提取网络数据的结构特征的具体流程为:为了在网络中量化各个公司之间的联系强度,首先加载各公司的数据集;通过领域知识,构建轮胎异质信息网络;轮胎异质信息网络是一种特殊的信息网络,它既包含多种类型的对象,也包含多种类型的链接关系;采用PathSim方法,将不同连接路径背后所隐藏的语义信息结合到对象相似性度量问题中;两个对象之间的PathSim值定义如下:这里,p(x~→y)表示在路径P模式下,对象x和y之间的路径个数;通过这个算法,把数据集构建成了轮胎网络,为下一步的链接扩展轮胎网络结构所做的准备。4.根据权利要求1所述的轮胎企业销售预测方法,其特征在于,所述链接扩展网络结构的具体流程为:在步骤(1)和步骤(2)中,已经得到网络拓扑结构和主题向量,采用节点对之间的潜在链接强度打分算法,加载步骤(1)和步骤(2)得到的结果,综合计算相似性,进一步扩展优化公司之间的联系,从而实现数据间的互相优化训练,以有效提升轮胎销售预测的准确率;本流程采用的算法:首先定义基于主题的相似性:给定R维欧式空间中的节点x和节点y的主题特征向量θ1和θ2,从二者的特征相似性出发,定义如下式所示,表示节点x和节点y之间基于文本内容的主题相似性大小:

【专利技术属性】
技术研发人员:李敏波廖倡许晓彬
申请(专利权)人:复旦大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1