The invention discloses a data mining method and device, and relates to the field of big data technology. The method of the invention is applied to the scene of setting the clearing price of goods, obtaining the historical data such as the sales volume and price of goods, automatically analyzing the massive data of goods sales by using the data mining method, and constructing the variables influencing the clearing by using the objective law that the sales volume of goods is affected by the price and other factors. Relational representation and optimal objective relation representation can set the clearing price which can fulfill the clearing target in a given time, improve the probability of fulfilling the clearing target in a given time, and improve the effect of goods clearing.
【技术实现步骤摘要】
数据挖掘方法以及装置
本专利技术涉及大数据
,特别涉及一种数据挖掘方法以及装置。
技术介绍
过去十几年来,互联网在人类各生活领域不断深化,人们的生活在互联网的影响下变得越来越方便,尤其实在电子商务上,人们已经逐渐习惯了通过网络购买各种货物和服务。在电商运营中,维持货物的健康库存是运营部门的重要工作目标。与此同时,受到服务水平需求及市场波动等不确定因素的影响,电商所经营的大量货物长期处于库存不健康状态,即货物库存量大于健康库存量。当该问题被监控系统发现,电商运营部门迫切需要找到将货物库存快速降低到健康库存线以下的方法。现行的清仓策略中,主要由采销人员根据货物销售的实际情况和对货物未来因变量的判断,依据经验,人工决定是否对特定货物进行降价清仓。对于被判定为适合进行降价清仓的货物,采销人员通过人工设定的方式修改网页第一自变量并发布。随后,采销人员人工观察该货物在降价后的销售情况,判断将货物的价格回调或者退货。上述对货物清仓的方法,整个清仓过程主要依赖于采销人员的经验,没有针对销量受价格等因素影响的客观变化情况进行量化分析,清仓效果难以保证。
技术实现思路
本专利技术所要实现的一个目的是:提出一种对货物销量和价格等因素进行客观大数据分析从而确定清仓价格的方法,能够提高在给定时间内完成清仓目标的概率。根据本专利技术的一个方面,提供的一种数据挖掘方法,包括:获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;根据待清仓货物的每天的因变量信息与第 ...
【技术保护点】
1.一种数据挖掘方法,其特征在于,包括:获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;确定所述预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值。
【技术特征摘要】
1.一种数据挖掘方法,其特征在于,包括:获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;确定所述预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值。2.根据权利要求1所述的方法,其特征在于,所述确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系包括:建立所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;利用所述待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对所述线性关系进行线性回归拟合,确定所述线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。3.根据权利要求1所述的方法,其特征在于,所述根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系包括:将所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为所述待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系;按照预设时间段的时长,将预设时间段内所述待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。4.根据权利要求1所述的方法,其特征在于,所述根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值包括:利用所述待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的所述预设时间段内第一自变量信息、第二自变量、常数项以及所述预设时间段内随机误差信息项,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换;在给定第二自变量值的情况下,根据所述预设时间段内随机误差信息项的分布情况,确定所述优化目标关系表示中的第一自变量值。5.根据权利要求4所述的方法,其特征在于,所述预设时间段内随机误差信息项的分布情况采用以下方法确定:利用蒙特卡洛算法根据所述随机误差的正态分布对每天的随机误差进行采样;对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值;按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对所述预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定所述预设时间段内随机误差信息项的分布情况。6.根据权利要求1所述的方法,其特征在于,还包括:确定货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;将货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系中第一自变量信息的系数作为第一自变量弹性系数,并与第一自变量弹性阈值进行比对,如果所述第一自变量弹性系数小于所述第一自变量弹性阈值,则将所述货物确定为待清仓货物。7.根据权利要求1所述的方法,其特征在于,还包括:将确定的所述优化目标关系表示中的第一自变量值与清仓最低阈值进行比对,如果确定的所述优化目标关系表示中的第一自变量大于或等于所述清仓最低阈值,则按照确定的所述优化目标关系表示中第一自变量进行清仓;或者,将确定的所述优化目标关系表示中第一自变量与清仓最高阈值进行比对,如果确定的所述优化目标关系表示中第一自变量大于或等于所述清仓最高阈值,则对所述待清仓货物按照所述清仓最高阈值进行清仓。8.根据权利要求1-7任一项所述的方法,其特征在于,所述因变量为销量,所述第一自变量为价格,所述第...
【专利技术属性】
技术研发人员:黄玮南,鲁艳阳,蒋佳涛,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。