【技术实现步骤摘要】
一种基于假设检验与0-1整数规划的商品选择方法
本专利技术属于计算机数据挖掘领域,更具体地,涉及一种基于假设检验与0-1整数规划的商品选择方法。
技术介绍
随着各种电子管理系统越来越多的应用到零售行业中,商家的销售记录普遍被记录了下来。通过分析商品销售历史,如何从商品的全集中,选择出一批最有价值的商品,使得这批商品在未来带来最大的销售利润,这一问题被称为商品选择问题,这一问题与零售行业的商业决策密切相关,使用科学的方法为这一问题给出准确的解决办法,能够更好的提高商家的竞争力。针对该问题,商家最常用的思路是根据过往的交易记录中,将商品按照其销售利润从高到低排列后进行选择,如果根据交易纪录一个商品的销量高,利润高,就保留该商品,同时去除那些利润较低的商品。由于在很多场景下,商品的销售并不是独立的,而是有一定的关联性,研究者们将这种商品销售中两两间的关联作用定义为交叉销售作用(Cross-sellingeffect),现有的商品选择方法并没有考虑到这种交叉销售作用,因此会忽略一些本身销售利润不高,但交叉销售作用强的商品,导致商品选择结果不准确。
技术实现思路
针对现有技术的 ...
【技术保护点】
一种基于假设检验与0‑1整数规划的商品选择方法,其特征在于,包括以下步骤:(1)从商品数据库中读取历史交易数据,并对该历史交易数据进行数据清洗,以分别得到交易数据D和利润数据,其中交易数据D包括交易ID和商品ID,利润数据包括商品ID和商品利润;(2)利用频繁项集挖掘算法对交易数据D进行处理,以得到大于等于项集支持度阈值的频繁项集;(3)利用假设检验的方法对步骤(2)得到的频繁项集进行过滤,以提取出多个项集构成有效项集集合;(4)利用步骤(3)构建的有效项集集合对交易数据D进行处理,以得到商品和有效项集的交易权重;(5)根据步骤(4)得到的商品和有效项集的交易权重、以及利润 ...
【技术特征摘要】
1.一种基于假设检验与0-1整数规划的商品选择方法,其特征在于,包括以下步骤:(1)从商品数据库中读取历史交易数据,并对该历史交易数据进行数据清洗,以分别得到交易数据D和利润数据,其中交易数据D包括交易ID和商品ID,利润数据包括商品ID和商品利润;(2)利用频繁项集挖掘算法对交易数据D进行处理,以得到大于等于项集支持度阈值的频繁项集;(3)利用假设检验的方法对步骤(2)得到的频繁项集进行过滤,以提取出多个项集构成有效项集集合;(4)利用步骤(3)构建的有效项集集合对交易数据D进行处理,以得到商品和有效项集的交易权重;(5)根据步骤(4)得到的商品和有效项集的交易权重、以及利润数据生成商品利润向量以及有效项集利润向量;(6)利用0-1整数规划对步骤(5)得到的商品利润向量与有效项集利润向量进行处理,从而得到商品选择结果。2.根据权利要求1所述的方法,其特征在于,项集X支持度su(X,D)等于:其中项集表示一个或多个商品I的集合,n(X)表示交易数据D中项集X出现的数量,n(D)表示交易数据D中的交易数量。项集支持度阈值的取值等于其中N表示交易数据D的提取周期;频繁项集挖掘算法是Apriori算法、FP-Growth算法或Eclat算法。3.根据权利要求2所述的方法,其特征在于,商品I的支持度su(I,D)等于:其中n(I)表示交易数据D中的商品数量。4.根据权利要求3所述的方法,其特征在于,步骤(3)具体为,计算得到某个项集的支持度su(X,D),然后,继续获得该项集中所有商品的支持度su(Ii,D)和su(Ij,D)、以及所有商品支持度的乘积su(Ii,D)*su(Ij,D),其后,定义零假设:su(X,D)服从参数为n(D)*su(Ii,D)*su(Ij,D)的泊松分布,显著性水平为0至0.1之间,对su(X,D)进行右侧检验,检验的结果如果零假设不成立,则该项集是有效项集,否则该项集不是有效项集。5.根据权利要求4所述的方法,其特征在于,步骤(4)包括以下子步骤,(4-1)获取交易数据D中商品种类的数量m(I),对交易数据D中的所有商品编号为num(I),并获取有效项集数量m(X),对所有有效项集编号为num(X),其中num(I)为1到m(I)间的自然数,num(X)为1到m(X)间的自然数;(4-2)初始化商品交易向量VI和有效项集交易向量VX为0,商品交易向量VI的长度为m(I),该向量中的第num(I)个值表示编号为num(I)的商品的交易权重,有效项集交易向量VX的长度为有效项集数量m(X),该向量中的第num(X)个值表示编号为num...
【专利技术属性】
技术研发人员:周可,王桦,夏路,乔宏永,孙锡林,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。