数据挖掘方法以及装置制造方法及图纸

技术编号:18668186 阅读:31 留言:0更新日期:2018-08-14 20:37
本发明专利技术公开了一种数据挖掘方法以及装置,涉及大数据技术领域。本发明专利技术的方法应用于制定货物的清仓价格的场景时,获取货物的销量和价格等历史数据,利用数据挖掘方法自动对货物销售的海量数据进行大数据分析,利用货物销量受价格等因素影响的客观规律,构建影响清仓的各变量间的关系表示以及优化目标关系表示,制定能够在给定时间内完成清仓目标的清仓价格,提高了在给定时间内完成清仓目标的概率,提高了货物清仓的效果。

Data mining methods and devices

The invention discloses a data mining method and device, and relates to the field of big data technology. The method of the invention is applied to the scene of setting the clearing price of goods, obtaining the historical data such as the sales volume and price of goods, automatically analyzing the massive data of goods sales by using the data mining method, and constructing the variables influencing the clearing by using the objective law that the sales volume of goods is affected by the price and other factors. Relational representation and optimal objective relation representation can set the clearing price which can fulfill the clearing target in a given time, improve the probability of fulfilling the clearing target in a given time, and improve the effect of goods clearing.

【技术实现步骤摘要】
数据挖掘方法以及装置
本专利技术涉及大数据
,特别涉及一种数据挖掘方法以及装置。
技术介绍
过去十几年来,互联网在人类各生活领域不断深化,人们的生活在互联网的影响下变得越来越方便,尤其实在电子商务上,人们已经逐渐习惯了通过网络购买各种货物和服务。在电商运营中,维持货物的健康库存是运营部门的重要工作目标。与此同时,受到服务水平需求及市场波动等不确定因素的影响,电商所经营的大量货物长期处于库存不健康状态,即货物库存量大于健康库存量。当该问题被监控系统发现,电商运营部门迫切需要找到将货物库存快速降低到健康库存线以下的方法。现行的清仓策略中,主要由采销人员根据货物销售的实际情况和对货物未来因变量的判断,依据经验,人工决定是否对特定货物进行降价清仓。对于被判定为适合进行降价清仓的货物,采销人员通过人工设定的方式修改网页第一自变量并发布。随后,采销人员人工观察该货物在降价后的销售情况,判断将货物的价格回调或者退货。上述对货物清仓的方法,整个清仓过程主要依赖于采销人员的经验,没有针对销量受价格等因素影响的客观变化情况进行量化分析,清仓效果难以保证。
技术实现思路
本专利技术所要实现的一个目的是:提出一种对货物销量和价格等因素进行客观大数据分析从而确定清仓价格的方法,能够提高在给定时间内完成清仓目标的概率。根据本专利技术的一个方面,提供的一种数据挖掘方法,包括:获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;根据待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;确定预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;根据待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对优化目标关系表示中的预设时间段内因变量总值进行替换,确定优化目标关系表示中的第一自变量值。在一个实施例中,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系包括:建立待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;利用待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对线性关系进行线性回归拟合,确定线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。在一个实施例中,根据待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系包括:将待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系;按照预设时间段的时长,将预设时间段内待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。在一个实施例中,根据待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系,对优化目标关系表示中的预设时间段内因变量总值进行替换,确定优化目标关系表示中的第一自变量值包括:利用待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的预设时间段内第一自变量信息、第二自变量、常数项以及预设时间段内随机误差信息项,对优化目标关系表示中的预设时间段内因变量总值进行替换;在给定第二自变量值的情况下,根据预设时间段内随机误差信息项的分布情况,确定优化目标关系表示中的第一自变量值。在一个实施例中,预设时间段内随机误差信息项的分布情况采用以下方法确定:利用蒙特卡洛算法根据随机误差的正态分布对每天的随机误差进行采样;对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值,按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对所述预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定所述预设时间段内随机误差信息项的分布情况。在一个实施例中,该方法还包括:确定货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;将货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系中第一自变量信息的系数作为第一自变量弹性系数,并与第一自变量弹性阈值进行比对,如果第一自变量弹性系数小于第一自变量弹性阈值,则将货物确定为待清仓货物。在一个实施例中,该方法还包括:将确定的优化目标关系表示中的第一自变量值与清仓最低阈值进行比对,如果确定的优化目标关系表示中的第一自变量大于或等于清仓最低阈值,则按照确定的优化目标关系表示中第一自变量进行清仓;或者,将确定的优化目标关系表示中第一自变量与清仓最高阈值进行比对,如果确定的优化目标关系表示中第一自变量大于或等于清仓最高阈值,则对待清仓货物按照清仓最高阈值进行清仓。在一个实施例中,因变量为销量,第一自变量为价格,第二自变量为库存状态,因变量信息为销量的自然对数值,第一自变量信息为价格的自然对数值。根据本专利技术的第二个方面,提供的一种数据挖掘装置,包括:第一关系确定模块,用于获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;第二关系确定模块,用于根据待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;优化目标关系表示确定模块,用于确定预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;第一自变量确定模块,用于根据待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对优化目标关系表示中的预设时间段内因变量总值进行替换,确定优化目标关系表示中的第一自变量值。在一个实施例中,第一关系确定模块,用于建立待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,利用待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对线性关系进行线性回归拟合,确定线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。在一个实施例中,第二关系确定模块,用于将待清仓货本文档来自技高网...

【技术保护点】
1.一种数据挖掘方法,其特征在于,包括:获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;确定所述预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值。

【技术特征摘要】
1.一种数据挖掘方法,其特征在于,包括:获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;确定所述预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值。2.根据权利要求1所述的方法,其特征在于,所述确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系包括:建立所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;利用所述待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对所述线性关系进行线性回归拟合,确定所述线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。3.根据权利要求1所述的方法,其特征在于,所述根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系包括:将所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为所述待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系;按照预设时间段的时长,将预设时间段内所述待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。4.根据权利要求1所述的方法,其特征在于,所述根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值包括:利用所述待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的所述预设时间段内第一自变量信息、第二自变量、常数项以及所述预设时间段内随机误差信息项,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换;在给定第二自变量值的情况下,根据所述预设时间段内随机误差信息项的分布情况,确定所述优化目标关系表示中的第一自变量值。5.根据权利要求4所述的方法,其特征在于,所述预设时间段内随机误差信息项的分布情况采用以下方法确定:利用蒙特卡洛算法根据所述随机误差的正态分布对每天的随机误差进行采样;对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值;按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对所述预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定所述预设时间段内随机误差信息项的分布情况。6.根据权利要求1所述的方法,其特征在于,还包括:确定货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;将货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系中第一自变量信息的系数作为第一自变量弹性系数,并与第一自变量弹性阈值进行比对,如果所述第一自变量弹性系数小于所述第一自变量弹性阈值,则将所述货物确定为待清仓货物。7.根据权利要求1所述的方法,其特征在于,还包括:将确定的所述优化目标关系表示中的第一自变量值与清仓最低阈值进行比对,如果确定的所述优化目标关系表示中的第一自变量大于或等于所述清仓最低阈值,则按照确定的所述优化目标关系表示中第一自变量进行清仓;或者,将确定的所述优化目标关系表示中第一自变量与清仓最高阈值进行比对,如果确定的所述优化目标关系表示中第一自变量大于或等于所述清仓最高阈值,则对所述待清仓货物按照所述清仓最高阈值进行清仓。8.根据权利要求1-7任一项所述的方法,其特征在于,所述因变量为销量,所述第一自变量为价格,所述第...

【专利技术属性】
技术研发人员:黄玮南鲁艳阳蒋佳涛
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1