基于自适应密度聚类算法的小区住户识别方法和系统技术方案

技术编号:27977260 阅读:24 留言:0更新日期:2021-04-06 14:11
本发明专利技术公开了一种基于自适应密度聚类算法的小区住户识别方法和系统,方法包括:基于DBSCAN算法构建密度聚类模型;将宽带用户的经纬度数据输入密度聚类模型中,计算得到初始小区聚类结果和初始核心宽带用户点;将初始核心宽带用户点标注于地图上,并与真实小区边界进行对比;根据对比结果和地图比例尺确定密度聚类模型的密度半径参数;根据预设的邻域密度阈值初始范围进行自适应调节,遍历得到小区核心宽带用户经纬度。通过本发明专利技术的技术方案,消除了传统人工方法产生的误差和无法定位问题,能够通过自适应调节得到目标小区的核心宽带住户,提高了目标数据的定位精确性,提高了针对空间区域进行定向营销活动的精准性。

【技术实现步骤摘要】
基于自适应密度聚类算法的小区住户识别方法和系统
本专利技术涉及地理信息计算
,尤其涉及一种基于自适应密度聚类算法的小区住户识别方法和一种基于自适应密度聚类算法的小区住户识别系统。
技术介绍
针对用户的电信营销活动已经从传统的广泛撒网方式,转化为时间和空间上的精准化操作,时间上的精准性是指实时的个性化精准化推荐,而空间上的精准性是指能够将用户定位在更精确的范围内,从而充分高效利用该精确范围内的资源对用户开展营销活动。当前,时间维度上的精准化营销技术已经发展的较为成熟,主流的技术也已被广泛应用,主要是将基于机器学习或深度学习算法的各种推荐模型运用在实际营销场景中,但基于空间的精准化营销技术还未形成较为成熟的方法,现有的位置营销也大都基于人工划定范围开展,效率较低,且不利于高质量营销活动开展。传统的空间层面的营销技术通过两种手段开展,第一个是通过仪器测量各小区或单位的位置边界,然后在测量的边界范围内开展定向营销活动,第二个是基于以往在各区域的营销经验,人为划定网格进行定向营销,但根据实际的营销效果反馈,两种方式均存在如下问题:1.对于目标数据,即指定区域的位置坐标和根据位置坐标计算识别的营销目标对象,人为因素会导致上传一定量的假数据和大量误差数据;2.仪器测量和人工划定的区域边界范围太过固定,导致营销对象识别圈定不灵活,妨碍了精准化营销活动的开展。
技术实现思路
针对上述问题,本专利技术提供了一种基于自适应密度聚类算法的小区住户识别方法和系统,通过基于DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise,基于密度的噪声应用空间聚类)算法构建的密度聚类模型,将初始聚类结果与地图真实小区边界进行对比确定密度聚类模型的密度半径参数,以该密度半径参数自适应调节密度聚类模型的邻域密度阈值,遍历得到小区核心宽带用户经纬度,在此基础上还能扩展得到密度半径范围以内的小区非核心宽带用户,从而得到目标小区的全量住户,提高了目标数据的定位精确性,提高了针对空间区域进行定向营销活动的精准性。为实现上述目的,本专利技术提供了一种基于自适应密度聚类算法的小区住户识别方法,包括:基于DBSCAN算法构建密度聚类模型;将宽带用户的经纬度数据输入所述密度聚类模型中,计算得到初始小区聚类结果和初始核心宽带用户点;将所述初始核心宽带用户点标注于地图上,并与真实小区边界进行对比;根据对比结果和所述地图比例尺确定所述密度聚类模型的密度半径参数;根据预设的邻域密度阈值初始范围进行自适应调节,遍历得到小区核心宽带用户经纬度。在上述技术方案中,优选地,所述根据预设的邻域密度阈值初始范围进行自适应调节,遍历得到小区核心宽带用户经纬度具体包括:根据确定的所述密度半径参数,在所述密度聚类模型中遍历循环输入预设的所述邻域密度阈值初始范围中的值;在遍历循环过程中,若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为多个簇,则将所述邻域密度阈值加一并进入下一循环;若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为空,则将所述邻域密度阈值减一并进入下一循环;若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为单个簇,则将结束循环,并以当前邻域密度阈值下聚类结果簇中的用户作为小区核心宽带用户,以得到小区核心宽带用户点的经纬度。在上述技术方案中,优选地,基于自适应密度聚类算法的小区住户识别方法还包括:以所述小区核心宽带用户点的邻域半径的圆的集合范围作为当前小区的实际地理范围。在上述技术方案中,优选地,基于自适应密度聚类算法的小区住户识别方法还包括:根据所述小区核心宽带用户经纬度计算得到目标小区中心位置点;以所述目标小区中心位置点为圆心向外扩展预设量经纬度的区域,并圈定扩展区域内除核心宽带用户外的其他用户作为待筛选用户;依次计算每个所述待筛选用户与每个所述小区核心宽带用户之间的距离;若一待筛选用户与所有的所述小区核心宽带用户之间的距离均小于所述密度半径参数,则将该待筛选用户作为小区非核心宽带用户;若一待筛选用户与任一所述小区核心宽带用户之间的距离大于所述密度半径参数,则将该待筛选用户作为非目标小区用户;输出所述小区核心宽带用户和所述小区非核心宽带用户作为目标小区全量住户。在上述技术方案中,优选地,所述依次计算每个所述待筛选用户与每个所述小区核心宽带用户之间的距离具体包括:基于所述待筛选用户与所述小区核心宽带用户的经纬度,利用二分查找算法依次计算所述待筛选用户与每个所述小区核心宽带用户之间的距离。本专利技术还提出一种基于自适应密度聚类算法的小区住户识别系统,应用如上述技术方案中任一项提出的基于自适应密度聚类算法的小区住户识别方法,包括:模型构建模块,用于基于DBSCAN算法构建密度聚类模型;初始聚类模块,用于将宽带用户的经纬度数据输入所述密度聚类模型中,计算得到初始小区聚类结果和初始核心宽带用户点;标注对比模块,用于将所述初始核心宽带用户点标注于地图上,并与真实小区边界进行对比;半径确定模块,用于根据对比结果和所述地图比例尺确定所述密度聚类模型的密度半径参数;用户识别模块,用于根据预设的邻域密度阈值初始范围进行自适应调节,并遍历得到小区核心宽带用户经纬度。在上述技术方案中,优选地,所述用户识别模块具体用于:根据确定的所述密度半径参数,在所述密度聚类模型中遍历循环输入预设的所述邻域密度阈值初始范围中的值;在遍历循环过程中,若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为多个簇,则将所述邻域密度阈值加一并进入下一循环;若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为空,则将所述邻域密度阈值减一并进入下一循环;若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为单个簇,则将结束循环,并以当前邻域密度阈值下聚类结果簇中的用户作为小区核心宽带用户,以得到小区核心宽带用户点的经纬度。在上述技术方案中,优选地,以所述小区核心宽带用户点的邻域半径的圆的集合范围作为当前小区的实际地理范围。在上述技术方案中,优选地,基于自适应密度聚类算法的小区住户识别系统还包括:中心确定模块,用于根据所述小区核心宽带用户经纬度计算得到目标小区中心位置点;区域扩展模块,用于以所述目标小区中心位置点为圆心向外扩展预设量经纬度的区域,并圈定扩展区域内除核心宽带用户外的其他用户作为待筛选用户;距离计算模块,用于依次计算每个所述待筛选用户与每个所述小区核心宽带用户之间的距离;用户筛选模块,在一待筛选用户与所有的所述小区核心宽带用户之间的距离均小于所述密度半径参数时,将该待筛选用户作为小区非核心宽带用户,在一待筛选用户与任一所述小区核心宽带用户之间的距离大于所述密度半径参数时,将该待筛选用户作为非目标小区用户;住户输出模块,用于输出所述小区核心宽带用户和所述小区非核心宽带用户作为目标小区全量住户。在上述技术方案中,优选地,所述距离计算模块具体用于:基于所述待筛选用户与所述小区核心宽带用户的经纬度,利用二分查找算法依次计算所述待筛选用户与每个所述小区核心宽带用户之间的距离。与本文档来自技高网...

【技术保护点】
1.一种基于自适应密度聚类算法的小区住户识别方法,其特征在于,包括:/n基于DBSCAN算法构建密度聚类模型;/n将宽带用户的经纬度数据输入所述密度聚类模型中,计算得到初始小区聚类结果和初始核心宽带用户点;/n将所述初始核心宽带用户点标注于地图上,并与真实小区边界进行对比;/n根据对比结果和所述地图比例尺确定所述密度聚类模型的密度半径参数;/n根据预设的邻域密度阈值初始范围进行自适应调节,遍历得到小区核心宽带用户经纬度。/n

【技术特征摘要】
1.一种基于自适应密度聚类算法的小区住户识别方法,其特征在于,包括:
基于DBSCAN算法构建密度聚类模型;
将宽带用户的经纬度数据输入所述密度聚类模型中,计算得到初始小区聚类结果和初始核心宽带用户点;
将所述初始核心宽带用户点标注于地图上,并与真实小区边界进行对比;
根据对比结果和所述地图比例尺确定所述密度聚类模型的密度半径参数;
根据预设的邻域密度阈值初始范围进行自适应调节,遍历得到小区核心宽带用户经纬度。


2.根据权利要求1所述的基于自适应密度聚类算法的小区住户识别方法,其特征在于,所述根据预设的邻域密度阈值初始范围进行自适应调节,遍历得到小区核心宽带用户经纬度具体包括:
根据确定的所述密度半径参数,在所述密度聚类模型中遍历循环输入预设的所述邻域密度阈值初始范围中的值;
在遍历循环过程中,若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为多个簇,则将所述邻域密度阈值加一并进入下一循环;
若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为空,则将所述邻域密度阈值减一并进入下一循环;
若所述密度聚类模型输出的小区宽带用户经纬度聚类结果为单个簇,则将结束循环,并以当前邻域密度阈值下聚类结果簇中的用户作为小区核心宽带用户,以得到小区核心宽带用户点的经纬度。


3.根据权利要求2所述的基于自适应密度聚类算法的小区住户识别方法,其特征在于,还包括:
以所述小区核心宽带用户点的邻域半径的圆的集合范围作为当前小区的实际地理范围。


4.根据权利要求1或3所述的基于自适应密度聚类算法的小区住户识别方法,其特征在于,还包括:
根据所述小区核心宽带用户经纬度计算得到目标小区中心位置点;
以所述目标小区中心位置点为圆心向外扩展预设量经纬度的区域,并圈定扩展区域内除核心宽带用户外的其他用户作为待筛选用户;
依次计算每个所述待筛选用户与每个所述小区核心宽带用户之间的距离;
若一待筛选用户与所有的所述小区核心宽带用户之间的距离均小于所述密度半径参数,则将该待筛选用户作为小区非核心宽带用户;
若一待筛选用户与任一所述小区核心宽带用户之间的距离大于所述密度半径参数,则将该待筛选用户作为非目标小区用户;
输出所述小区核心宽带用户和所述小区非核心宽带用户作为目标小区全量住户。


5.根据权利要求4所述的基于自适应密度聚类算法的小区住户识别方法,其特征在于,所述依次计算每个所述待筛选用户与每个所述小区核心宽带用户之间的距离具体包括:
基于所述待筛选用户与所述小区核心宽带用户的经纬度,利用二分查找算法依次计算所述待筛选用户与每个所述小区核心宽带用户之间的距离。


6.一种基于自适应密度聚类算法的小区住户识别...

【专利技术属性】
技术研发人员:韦强
申请(专利权)人:北京思特奇信息技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1