基于K-means聚类算法及离散小波变换的无人超市客流量预测方法技术

技术编号:20329855 阅读:14 留言:0更新日期:2019-02-13 06:11
本本发明专利技术公开一种基于K‑means聚类算法及离散小波变换的无人超市客流量预测方法,包括:获取用户的流量数据,所述流量数据包括客流量数据;将所述流量数据按照时间特征和店铺特征进行序列化形成多个时间序列;通过聚类算法对历史数据进行聚类;通过基本统计学算法与所述多个时间序列数据,计算所述流量数据的均值方差增长率等;通过小波变换算法对所述多个时间序列数据进行分解处理,以获取时间序列子波;以及将所述时间序列子波,所述均值与所述方差及所述增长率作为特征值输入预测模型中,以获取所述用户在预定时间段中的流量数据预测值。本发明专利技术能够对未来无人超市客流量进行有效预测,并对商家经营模式起到指导作用。

【技术实现步骤摘要】
基于K-means聚类算法及离散小波变换的无人超市客流量预测方法
本专利技术属于计算机信息处理领域,尤其涉及一种基于K-means聚类算法及离散小波变换的无人超市客流量预测方法。
技术介绍
近年来,无人超市的兴起引起广泛关注,其便捷的购物模式脱颖而出。对于商家而言,提高其便捷性以及分配性更能掀起购物新狂潮。所以,对超市未来客流量的精准预测可以很好的激起这波潮流。现有技术中,对无人超市客流进行预测方法很少,借鉴其他方向预测客流量的方法,这里的客流量是时间序列形式,对于时间序列的预测比较流行的是统计学中的ARMA。ARMA(自回归滑动平均模型),不直接考虑其他相关随机变量的变化,因此,不适合有强噪声的数据使用;还有基于基本统计特征方法提取的回归分析法,但是该方法计算量大,过程复杂,预测精度低;因此,需要一种新的用于数据预测的方法、装置、电子设备及计算机可读介质。
技术实现思路
本专利技术针对现有解决方案的上述不足,提供一种无人超市客流量预测方法,能够对未来无人超市客流量进行有效预测,并对商家的经营模式进行有效指导。本专利技术的基于K-means聚类算法及离散小波变换的无人超市客流量预测方法,该方法包括:获取每个店铺的流量数据,所述流量数据包括店铺客流量数据;将所述流量数据按照时间以及店铺特征分解成每家店铺每天客流量数据,进行序列化;通过K-means聚类算法对流量数据进行聚类,以拆分不同数据模型;通过基本统计学算法与所述聚类之后各个模型的数据,计算各个模型流量数据的均值与方差,以及增长率加速度等基本统计学特征;通过小波变换算法对所述多个时间序列数据进行分解处理,以获取时间序列子波;以及将所述时间序列子波,所述均值,所述方差值与所述增长率值及所述加速度值进行归一化处理,最后作为特征输入提升树预测模型中进行训练得到各聚类模型,以获取所述店铺在预测时间段中的流量数据预测值。在本公开的一种示例性实施例中,所述将所述流量数据按照时间以及店铺特征分解成每家店铺每天客流量数据,包括:按店铺按日期形成唯一性的流量数据,并标记每天的星期特征,并将每家店铺的流量数据按照日期升序排列。在本公开的一种示例性实施例中,所述通过K-means聚类算法对流量数据进行聚类,以拆分不同数据模型,包括:将所述流量数据以七天为时间步长,取当天日期前六天数据组合成七天为一个分组的流量数据,该分组对应当天日期以及所属店铺,将所述流量数据进行如上所述拆分组合,将分解之后的数据输入K-means算法进行聚类。在本公开的一种示例性实施例中,所述K-means聚类算法簇的个数为6类,初始簇中心的获取方法为k-means++,获取初始簇中心的更迭次数为12次初始质心。在本公开的一种示例性实施例中,所述获取所述店铺在预定时间段中的流量数据预测值,包括:获取所述店铺在未来一个月中的流量数据预测值;所述流量数据预测值包括未来一个月中每一天的流量数据。在本公开的一种示例性实施例中,所述通过基本统计学算法与所述多个时间序列数据,计算聚类之后流量数据的均值与方差,以及增长率加速度等基本统计学特征,包括:获取目标时间点历史前7天流量均值和方差;获取目标时间点历史前3天的增长率;获取目标时间点历史前7天增长率的均值和方差;获取目标时间点历史前3天的加速度(即增长率的增长率);获取目标时间点历史前7天的加速度的均值和方差。在本公开的一种示例性实施例中,所述通过小波变换算法对所述多个时间序列数据进行分解处理,以获取时间序列子波,包括:通过离散小波变换算法对所述多个时间序列数据进行分解处理,以获取时间序列子波。在本公开的一种示例性实施例中,所述离散小波变换算法的分解层数为2层;母小波为Daubechies小波簇中的db2小波;以及边界扩展函数为zero-padding。在本公开的一种示例性实施例中,所述梯度提升回归(Gradientboostingregression,GBR)预测模型包括:多个子模型,即聚类之后的6类模型,所述多个子模型独立存在。本专利技术能够对未来无人超市客流量进行有效预测,并对商家经营模式产生指导作用,提升无人超市的智能化。附图说明通过参照附图详细描述其示例实施例,本专利技术的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的一种用于数据预测的方法的流程图。图2是根据另一示例性实施例示出的一种用于数据预测的方法中客流量数据的示意图。图3是根据一示例性实施例示出的一种用于数据预测的方法中不同模型预测效果比较图。图4是根据一示例性实施例示出的一种用于数据预测的装置的框图。图5是根据一示例性实施例示出的一种电子设备的框图。图6是根据一示例性实施例示出的一种电子设备的框图。图7是根据一示例性实施例示出一种计算机可读存储介质示意图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本专利技术将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本专利技术的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本专利技术的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本专利技术的各方面。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本专利技术所必须的,因此不能用于限制本专利技术的保护范围。图1是根据一示例性实施例示出的一种用于数据预测的方法的流程图。如图1所示,在S102中,获取店铺的流量数据,所述流量数据包括客流量数据。获取到的店铺的流量数据例如为客流量数据以天为单位。表1展示了流量数据的格式。其中,record_day为记录时间,store_id为店铺的编号,customer为店铺的客流量。流量数据中包含五家店铺的客流量数据。表1流量数据的格式在S104中,将所述流量数据按照时间以及店铺特征分解成每家店铺每天客流本文档来自技高网...

【技术保护点】
1.一种基于K‑means聚类算法及离散小波变换的无人超市客流量预测方法,其特征在于,包括:获取每个店铺的流量数据,所述流量数据包括店铺客流量数据;将所述流量数据按照时间以及店铺特征分解成每家店铺每天客流量数据,进行序列化;通过K‑means聚类算法对流量数据进行聚类,以拆分不同数据模型;通过基本统计学算法与所述聚类之后各个模型的数据,计算各个模型流量数据的均值与方差,以及增长率加速度等基本统计学特征;通过小波变换算法对所述多个时间序列数据进行分解处理,以获取时间序列子波;以及将所述时间序列子波,所述均值,所述方差值与所述增长率值及所述加速度值进行归一化处理,最后作为特征输入提升树预测模型中进行训练得到各聚类模型,以获取所述店铺在预测时间段中的流量数据预测值。

【技术特征摘要】
1.一种基于K-means聚类算法及离散小波变换的无人超市客流量预测方法,其特征在于,包括:获取每个店铺的流量数据,所述流量数据包括店铺客流量数据;将所述流量数据按照时间以及店铺特征分解成每家店铺每天客流量数据,进行序列化;通过K-means聚类算法对流量数据进行聚类,以拆分不同数据模型;通过基本统计学算法与所述聚类之后各个模型的数据,计算各个模型流量数据的均值与方差,以及增长率加速度等基本统计学特征;通过小波变换算法对所述多个时间序列数据进行分解处理,以获取时间序列子波;以及将所述时间序列子波,所述均值,所述方差值与所述增长率值及所述加速度值进行归一化处理,最后作为特征输入提升树预测模型中进行训练得到各聚类模型,以获取所述店铺在预测时间段中的流量数据预测值。2.如权利要求1所述的基于K-means聚类算法及离散小波变换的无人超市客流量预测方法,其特征在于,所述将所述流量数据按照时间以及店铺特征分解成每家店铺每天客流量数据,包括:按店铺按日期形成唯一性的流量数据,并标记每天的星期特征,并将每家店铺的流量数据按照日期升序排列。3.如权利要求1所述的基于K-means聚类算法及离散小波变换的无人超市客流量预测方法,其特征在于,所述通过K-means聚类算法对流量数据进行聚类,以拆分不同数据模型,包括:将所述流量数据以七天为时间步长,取当天日期前六天数据组合成七天为一个...

【专利技术属性】
技术研发人员:阎长顺吕高帆邵勇刘博
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1