一种基于聚类分析的社区用户引导方法及系统技术方案

技术编号:34851033 阅读:21 留言:0更新日期:2022-09-08 07:51
本发明专利技术提供了一种基于聚类分析的社区用户引导方法及系统,包括:获取社区周围兴趣点数据,并对社区周围兴趣点进行聚类,划分为多个不同形状大小的聚类区域,并获取聚类区域内的各类兴趣点分布比例以及兴趣点热度总和;所述兴趣点数据包括兴趣点访问频率和兴趣点的地理位置信息;将社区周围所有聚类区域的热度值进行加权整合以得出社区的活力值;通过社区的活力值、兴趣点分布情况以及各类兴趣点所占比例为用户的居住或者店铺选址提供信息参考以引导用户做出最优选择;结合大数据为商家的入驻提供参考信息,为待入住的居民以及意向发展产业的商家提供较为综合的分析结果,帮助用户做出准确的判断。户做出准确的判断。户做出准确的判断。

【技术实现步骤摘要】
一种基于聚类分析的社区用户引导方法及系统


[0001]本专利技术属于大数据处理
,具体涉及一种基于聚类分析的社区用户引导方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]聚类是一种将对象集合按照一定的标准划分为多个类别的过程,在所划分的类别中,对象之间的距离(或相似度)较近,而不同类中的对象之间距离较远。在数据量较为庞大且类型未知的情况下,聚类能够对数据进行整理,从而加速数据检索或计算过程。
[0004]在所涉及到的应用场景中,社区的活力预测方法主要以社区周围兴趣点(如餐饮、住宿、以及娱乐地点)的分布情况以及热度分析为主,但目前需要商家或居民自己大量查阅搜索相关社区的信息才能获取符合自身入驻要求的社区,而搜索难度大,有时需要数周甚至一个月才能找到自己满意的社区。
[0005]对此,如何结合大数据为商家的入驻提供参考信息,为待入住的居民以及意向发展产业的商家提供较为综合的分析结果,帮助用户做出准确的判断是目前需要解决的问题。

技术实现思路

[0006]本专利技术为了解决上述问题,本专利技术在DV

DBSCAN算法聚类结果的基础之上,将聚类区域内兴趣点本身的访问频率作为考量以计算区域热度,并且最终将社区周围聚类区域的热度值按照相对距离加权以得出社区的整体热度。此外,针对每个聚类区域统计各类兴趣点所占比例,为商家的入驻提供参考信息。与其它的社区活力预测方法相比,本专利技术将兴趣点的地理位置分布与兴趣点本身的访问频率相结合,为待入住的居民以及意向发展产业的商家提供较为综合的分析结果,帮助系统用户做出准确的判断。
[0007]第一方面,本专利技术提供了一种基于聚类分析的社区用户引导方法,包括:
[0008]获取社区周围兴趣点数据,并对社区周围兴趣点进行聚类,划分为多个不同形状大小的聚类区域,并获取聚类区域内的各类兴趣点分布比例以及兴趣点热度总和;所述兴趣点数据包括兴趣点访问频率和兴趣点的地理位置信息;
[0009]将社区周围所有聚类区域的热度值进行加权整合以得出社区的活力值;
[0010]通过社区的活力值、兴趣点分布情况以及各类兴趣点所占比例为用户的居住或者店铺选址提供信息参考以引导用户做出最优选择。
[0011]进一步的,所述对社区周围兴趣点进行聚类是采用DBSCAN算法对距离社区中心一定范围内的兴趣点进行聚类。
[0012]进一步的,所述DBSCAN算法以设定的密度阈值为准对社区周围的兴趣点进行聚类,密度阈值分为两个部分:聚类半径阈值以及聚类点数量阈值,根据给定的密度阈值,所
有的兴趣点被分为核心点、边界点与离群点。
[0013]进一步的,根据上述兴趣点的定义将兴趣点标记为核心点、边界点与离群点;
[0014]将相对距离小于聚类半径阈值的核心点相连接,而这些核心点分别形成半径为聚类半径阈值的小型簇,在连通的过程中这些小型簇被合并为连续分布的聚类区域;
[0015]将剩余的边界点分配至距离较近的核心点形成的小型簇中,由此完成社区周围兴趣点的聚类过程。
[0016]进一步的,所述DBSCAN算法在迭代过程中,对每一组候选密度阈值所形成的聚类结果进行统计,如果出现连续多组候选密度阈值所对应的聚类数量相同的情况,则表示在该候选密度阈值聚类趋于稳定,并且取其中最后一组候选密度阈值为DBSCAN的最终密度阈值。
[0017]进一步的,所述社区的活力值由社区周围所有聚类区域的热度值加权整合以得出,计算过程中各聚类区域所采用的权重为聚类区域中心点与社区中心点的相对距离的倒数。
[0018]进一步的,所述社区周围兴趣点数据还包括兴趣点数据,兴趣点数据中兴趣点所属类别为主要提取的属性。
[0019]第二方面,本专利技术提供了一种基于聚类分析的社区用户引导系统,包括
[0020]数据获取模块,被配置为获取社区周围兴趣点数据,并对社区周围兴趣点进行聚类,划分为多个不同形状大小的聚类区域,并获取聚类区域内的各类兴趣点分布比例以及兴趣点热度总和;所述兴趣点数据包括兴趣点访问频率和兴趣点的地理位置信息;
[0021]数据处理模块,被配置为将社区周围所有聚类区域的热度值进行加权整合以得出社区的活力值;
[0022]引导模块,被配置为通过社区的活力值、兴趣点分布情况以及各类兴趣点所占比例为用户的居住或者店铺选址提供信息参考以引导用户做出最优选择。
[0023]第三方面,本专利技术提供了一种计算机可读存储介质,用于存储计算机指令,其特征在于,所述计算机指令被处理器执行时,完成如第一方面所述的基于聚类分析的社区用户引导方法。
[0024]第四方面,本专利技术提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成如第一方面所述的基于聚类分析的社区用户引导方法。
[0025]与现有技术相比,本专利技术的有益效果为:
[0026]1、本专利技术所提出的社区活力预测方法以DBSCAN算法对社区周围的兴趣点进行聚类,DBSCAN算法能够根据兴趣点的分布密度,按照所设定的密度阈值将多个兴趣点划分为簇,并且将每个小范围的簇相连以形成聚类区域。相比于其它的聚类算法,DBSCAN算法不需要预先指定聚类数量,且划分后的聚类区域并不局限于固定的形状或大小,适用于分布情况复杂且依赖于分布密度的兴趣点聚类。然而DBSCAN的密度阈值需要人为进行设置,且该值影响聚类的效果。为了使聚类性能达到最佳,本专利技术提出了一种基于密度变化的DBSCAN算法(DBSCAN based on density

variation,以下称DV

DBSCAN),以根据社区周围兴趣点的总体分布情况生成多组密度阈值以进行聚类过程的优化,解决了如何结合大数据为商家的入驻提供参考信息,为待入住的居民以及意向发展产业的商家提供较为综合的分析结
果,帮助用户做出准确的判断的问题。
[0027]2、本专利技术在DV

DBSCAN算法聚类结果的基础之上,将聚类区域内兴趣点本身的访问频率作为考量以计算区域热度,并且最终将社区周围聚类区域的热度值按照相对距离加权以得出社区的整体热度。此外,本专利技术针对每个聚类区域统计各类兴趣点所占比例,为商家的入驻提供参考信息。与其它的社区活力预测方法相比,本专利技术将兴趣点的地理位置分布与兴趣点本身的访问频率相结合,为待入住的居民以及意向发展产业的商家提供较为综合的分析结果,帮助系统用户做出准确的判断。
[0028]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
[0029]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0030]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于聚类分析的社区用户引导方法,其特征在于,包括:获取社区周围兴趣点数据,并对社区周围兴趣点进行聚类,划分为多个不同形状大小的聚类区域,并获取聚类区域内的各类兴趣点分布比例以及兴趣点热度总和;所述兴趣点数据包括兴趣点访问频率和兴趣点的地理位置信息;将社区周围所有聚类区域的热度值进行加权整合以得出社区的活力值;通过社区的活力值、兴趣点分布情况以及各类兴趣点所占比例为用户的居住或者店铺选址提供信息参考以引导用户做出最优选择。2.如权利要求1所述的于聚类分析的社区用户引导方法,其特征在于,所述对社区周围兴趣点进行聚类是采用DBSCAN算法对距离社区中心一定范围内的兴趣点进行聚类。3.如权利要求2所述的于聚类分析的社区用户引导方法,其特征在于,所述DBSCAN算法以设定的密度阈值为准对社区周围的兴趣点进行聚类,密度阈值分为两个部分:聚类半径阈值以及聚类点数量阈值,根据给定的密度阈值,所有的兴趣点被分为核心点、边界点与离群点。4.如权利要求3所述的于聚类分析的社区用户引导方法,其特征在于,根据上述兴趣点的定义将兴趣点标记为核心点、边界点与离群点;将相对距离小于聚类半径阈值的核心点相连接,而这些核心点分别形成半径为聚类半径阈值的小型簇,在连通的过程中这些小型簇被合并为连续分布的聚类区域;将剩余的边界点分配至距离较近的核心点形成的小型簇中,由此完成社区周围兴趣点的聚类过程。5.如权利要求2所述的于聚类分析的社区用户引导方法,其特征在于,所述DBSCAN算法在迭代过程中,对每一组候选密度阈值所形成的聚类结果进行统计,如果出现连续多组候选密度阈值所对应的聚类数量相...

【专利技术属性】
技术研发人员:管洪清徐亮王伟张元杰张大千尹广楹孙浩云
申请(专利权)人:青岛文达通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1