一种基于大数据的新商圈位置选取方法技术

技术编号:38864023 阅读:12 留言:0更新日期:2023-09-17 10:04
本发明专利技术涉及数据处理技术领域,具体涉及一种基于大数据的新商圈位置选取方法,该方法根据消费者在不同高频消费区域的消费频率,得到每个高频消费区域对应的优选消费者,根据优选消费者的参考位置得到参考位置集合,根据参考位置集合内优选消费者的消费频率差异得到稳定程度,根据参考位置的位置分布特征得到距离特征值,并根据稳定程度、距离特征值和参考位置数量,得到每个参考位置集合对应的参考权重,并结合参考位置集合的参考权重和对应样本点位置进行聚类分析,选取新商圈位置。本发明专利技术通过计算并引入参考权重进行聚类分析所选取的新商圈位置更加准确,且更加切合实际消费者的消费需求。的消费需求。的消费需求。

【技术实现步骤摘要】
一种基于大数据的新商圈位置选取方法


[0001]本专利技术涉及数据处理
,具体涉及一种基于大数据的新商圈位置选取方法。

技术介绍

[0002]随着大数据时代的来临,大数据分析的重要性与日俱增,对消费数据进行大数据分析更是其中的热点之一。线下商圈是消费者的主要消费地点之一,而且由于电子支付的广泛应用,消费者在线下商圈的消费更加有迹可循,所以可根据消费者在线下商圈的消费情况数据进行分析,进一步根据分析结果选取适合商圈运营的新商圈位置。
[0003]现有技术在选取新商圈位置时,通常根据消费者的位置分布情况,采用传统的聚类算法进行聚类,并将最终聚类结果中聚类中心的位置作为新商圈位置。传统的聚类算法衡量相似度的计算方法为欧氏距离,即仅根据消费者的位置进行聚类分析,但是随着交通的发达,消费者的出行更加便利,距离已经不是消费者选择消费商圈的主要影响因素,即消费者的消费行为受到距离的影响降低;同时由于消费水平的提高,消费者越来越依靠其消费意愿进行消费,即消费者的消费行为受到自身消费意愿的影响提高。所以结合消费者的消费行为受到距离的影响降低和受到自身消费意愿的影响提高两个因素,仅通过欧氏距离进行聚类分析决定新商圈位置时,考虑的影响因素较少,会造成所选取的新商圈的位置选取不准确,从而不能准确的切合实际消费者的消费需求。

技术实现思路

[0004]为了解决现有技术仅通过欧氏距离进行聚类分析来进一步选取新商圈位置时,对应的新商圈的位置选取不准确的技术问题,本专利技术的目的在于提供一种基于大数据的新商圈位置选取方法,所采用的技术方案具体如下:
[0005]本专利技术提出了一种基于大数据的新商圈位置选取方法,所述方法包括:
[0006]获取消费者在每个商圈中不同消费区域的消费频率,根据所述消费频率的分布特征得到高频消费区域;
[0007]根据消费者在不同高频消费区域的消费频率,得到每个高频消费区域对应的优选消费者;将每个优选消费者在对应高频消费区域消费后当天的住宿位置,作为每个优选消费者的参考位置;根据每个高频消费区域对应的参考位置的分布特征,得到至少两个参考位置集合;
[0008]根据所述参考位置集合内参考位置的数量和对应优选消费者的消费频率差异,得到每个参考位置集合的稳定程度;根据参考位置集合内参考位置的位置分布特征,得到每个参考位置集合对应的距离特征值;根据参考位置集合内的参考位置数量、对应的稳定程度和距离特征值,得到每个参考位置集合的参考权重;
[0009]根据参考权重和参考位置集合对应的位置对所有参考位置集合进行聚类分析,根据聚类分析结果选取新商圈位置。
[0010]进一步地,所述高频消费区域的获取方法包括:
[0011]计算消费者在每个商圈中不同消费区域的消费频率均值,将大于所述消费频率均值的消费区域作为高频消费区域。
[0012]进一步地,所述优选消费者的获取方法包括:
[0013]任选一个高频消费区域作为目标高频消费区域,将每个消费者对应消费频率最高的高频消费区域作为对应的所属消费区域,将以目标高频消费区域为所属消费区域的消费者,作为目标高频消费区域对应的优选消费者。
[0014]进一步地,所述参考位置集合的获取方法包括:
[0015]对于任意一个高频消费区域:
[0016]统计每个优选消费者的参考位置,根据参考位置计算每个优选消费者和自己最近的优选消费者之间的距离,并将所述距离作为每个优选消费者对应的特征距离,将所述特征距离小于或等于特征距离均值的优选消费者作为集中消费者,根据所有集中消费者的参考位置通过k

means聚类算法进行聚类分析,得到至少两个参考位置集合。
[0017]进一步地,所述稳定程度的获取方法包括:
[0018]统计每个参考位置集合中的参考位置数量;将优选消费者在对应高频消费区域的消费频率作为优选消费频率,将每个参考位置集合对应的所有优选消费频率的方差作为频率方差;根据所述频率方差和所述参考位置数量得到每个参考位置集合的稳定程度,所述稳定程度与所述频率方差呈负相关,所述稳定程度与所述参考位置数量呈正相关。
[0019]进一步地,所述距离特征值的获取方法包括:
[0020]将参考位置集合内每个参考位置到对应高频消费区域的距离作为参考距离,将每个参考位置集合中所有参考距离的均值,作为距离特征值。
[0021]进一步地,所述参考权重的获取方法包括:
[0022]根据参考位置集合对应的参考位置数量和稳定程度得到稳定特征值,所述稳定特征值与所述参考位置数量呈正相关,所述稳定特征值与所述稳定程度呈正相关;
[0023]将所述稳定特征值的正相关映射值与所述距离特征值的正相关映射值的乘积,作为对应参考位置集合的参考权重。
[0024]进一步地,所述根据参考权重和参考位置集合对应的位置对所有参考位置集合进行聚类分析包括:
[0025]将参考位置集合的每个参考位置中与其他参考位置之间距离累加和最小的参考位置坐标,作为参考位置集合的样本点坐标,根据样本点坐标得到每个参考位置集合对应的样本点;
[0026]通过K

means聚类算法根据样本点的位置和对应的参考权重进行聚类分析,所述聚类分析过程包括:随机选取预设数量个初始聚类中心,根据样本点到每个初始聚类中心的距离得到每个样本点对应的初始聚类集合,将初始聚类集合中每个样本点的坐标与对应的参考权重加权后的坐标均值,作为初始聚类集合对应的迭代聚类中心的坐标,根据迭代聚类中心重新进行聚类集合的划分,若重新划分后的聚类结果没有改变,则将迭代聚类中心作为最终聚类中心;若重新划分后的聚类结果发生变化,继续迭代直至聚类结果不发生改变,并将聚类结果没有改变时的聚类中心作为最终聚类中心。
[0027]进一步地,所述根据聚类分析结果选取新商圈位置包括:
[0028]将聚类分析结果中的最终聚类中心的位置作为新商圈位置。
[0029]本专利技术具有如下有益效果:
[0030]考虑到消费者在不同消费区域的消费频率不同,消费频率较低的消费区域对应的数据参考价值不大,所以本专利技术首先根据消费者在不同消费区域的消费频率,得到每个高频消费区域的优选消费者,通过对优选消费者的消费行为进行分析,对应的消费数据更加具有参考性。进一步考虑到由于交通的便利和消费水平的提高,消费者在选择消费区域进行消费时,受到自身消费意愿的影响越来越高。本专利技术根据优选消费者的参考位置分布特征得到参考位置集合,并结合参考位置集中优选消费者的数量和消费意愿,获取每个参考位置集合的参考权重,通过参考权重在表征距离因素影响的同时结合了消费者的消费意愿,进一步在对参考位置集合进行聚类分析时引入参考权重,使得所得到的聚类分析结果受到消费者距离影响的同时也受到消费者消费意愿的影响,使得后续根据通过聚类分析所选取的新商圈位置更加准确,即更加切合实际消费者的消费需求。
附图说明
[0031]为了更清楚地说明本专利技术实施例或现本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的新商圈位置选取方法,其特征在于,所述方法包括:获取消费者在每个商圈中不同消费区域的消费频率,根据所述消费频率的分布特征得到高频消费区域;根据消费者在不同高频消费区域的消费频率,得到每个高频消费区域对应的优选消费者;将每个优选消费者在对应高频消费区域消费后当天的住宿位置,作为每个优选消费者的参考位置;根据每个高频消费区域对应的参考位置的分布特征,得到至少两个参考位置集合;根据所述参考位置集合内参考位置的数量和对应优选消费者的消费频率差异,得到每个参考位置集合的稳定程度;根据参考位置集合内参考位置的位置分布特征,得到每个参考位置集合对应的距离特征值;根据参考位置集合内的参考位置数量、对应的稳定程度和距离特征值,得到每个参考位置集合的参考权重;根据参考权重和参考位置集合对应的位置对所有参考位置集合进行聚类分析,根据聚类分析结果选取新商圈位置。2.根据权利要求1所述的一种基于大数据的新商圈位置选取方法,其特征在于,所述高频消费区域的获取方法包括:计算消费者在每个商圈中不同消费区域的消费频率均值,将大于所述消费频率均值的消费区域作为高频消费区域。3.根据权利要求1所述的一种基于大数据的新商圈位置选取方法,其特征在于,所述优选消费者的获取方法包括:任选一个高频消费区域作为目标高频消费区域,将每个消费者对应消费频率最高的高频消费区域作为对应的所属消费区域,将以目标高频消费区域为所属消费区域的消费者,作为目标高频消费区域对应的优选消费者。4.根据权利要求1所述的一种基于大数据的新商圈位置选取方法,其特征在于,所述参考位置集合的获取方法包括:对于任意一个高频消费区域:统计每个优选消费者的参考位置,根据参考位置计算每个优选消费者和自己最近的优选消费者之间的距离,并将所述距离作为每个优选消费者对应的特征距离,将所述特征距离小于或等于特征距离均值的优选消费者作为集中消费者,根据所有集中消费者的参考位置通过k

means聚类算法进行聚类分析,得到至少两个参考位置集合。5.根据权利要求1所述的一种基于大数据的新商圈位置选取方法,其特征在于,所述稳定程度的获取方法包括:统计每个参考位置集合中的参考位置数量;将优选...

【专利技术属性】
技术研发人员:刘花
申请(专利权)人:陕西长瑞安驰信息技术集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1