用户地理画像生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24209694 阅读:21 留言:0更新日期:2020-05-20 16:17
本申请涉及一种用户地理画像生成方法、装置、计算机设备和存储介质。所述方法涉及大数据分析技术,包括:获取业务用户的定位服务数据;通过基于密度的聚类算法,对定位服务数据进行密度聚类处理,得到定位服务数据的数据簇;从数据簇中,确定业务用户的地理画像基准位置所属的基准位置簇;其中,地理画像基准位置包括进行用户地理画像生成时的参考位置;对基准位置簇进行聚类处理,得到基准位置簇的簇中心;基于簇中心和定位服务数据,生成业务用户的用户地理画像。采用本方法能够提高用户地理画像准确性。

Method, device, computer equipment and storage medium for generating user's geographical image

【技术实现步骤摘要】
用户地理画像生成方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种用户地理画像生成方法、装置、计算机设备和存储介质。
技术介绍
定位服务(LocationBasedServices,LBS)是当前移动终端服务中的热点。在当前移动应用市场中,LBS的应用非常广泛,购物应用中,利用LBS获取用户位置,既省去了用户手动输入位置信息的繁琐过程,又为配送仓库的选择提供了地理位置信息的依据;在导航应用中,LBS实时获取用户的位置信息并返回给用户,使路况信息的获取和查询更加直观和简单;除此之外,在社交、天气、打车、团购、旅游等各种移动应用中,LBS都扮演着重要的角色,LBS所提供的地理位置信息能够丰富应用的功能,并极大方便了用户的生活。目前,在对定位服务数据进行数据挖掘后,一般会通过各种标签为各业务用户进行画像,再基于用户画像提供对应服务,如何准确生成业务用户的画像成为提供对应高质量服务的重要基础。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高用户地理画像准确性的用户地理画像生成方法、装置、计算机设备和存储介质。一种用户地理画像生成方法,所述方法包括:获取业务用户的定位服务数据;通过基于密度的聚类算法,对定位服务数据进行密度聚类处理,得到定位服务数据的数据簇;从数据簇中,确定业务用户的地理画像基准位置所属的基准位置簇;其中,地理画像基准位置包括进行用户地理画像生成时的参考位置;对基准位置簇进行聚类处理,得到基准位置簇的簇中心;基于簇中心和定位服务数据,生成业务用户的用户地理画像。在其中一个实施例中,通过基于密度的聚类算法,对定位服务数据进行密度聚类处理,得到定位服务数据的数据簇包括:获取预设的核心点覆盖半径和核心点覆盖数目阈值;按照核心点覆盖半径和核心点覆盖数目阈值,通过DBSCAN算法对定位服务数据进行聚类迭代处理,得到定位服务数据的核心点;对各核心点进行聚类迭代处理,得到由核心点组成的定位服务数据的数据簇。在其中一个实施例中,对各核心点进行聚类迭代处理,得到由核心点组成的定位服务数据的数据簇包括:获取预设的核心点组合距离阈值;按照核心点组合距离阈值,通过DBSCAN算法对各核心点进行聚类迭代处理,得到由核心点组成的定位服务数据的数据簇。在其中一个实施例中,地理画像基准位置包括家庭地址和工作地址;从数据簇中,确定业务用户的地理画像基准位置所属的基准位置簇包括:确定数据簇中定位服务数据的数目及定位服务数据的时段分布;根据数据簇中定位服务数据的数目和时段分布,确定家庭地址所属的家庭地址簇和工作地址所属的工作地址簇;根据家庭地址簇和工作地址簇得到基准位置簇。在其中一个实施例中,方法还包括:当数据簇的数目为0时,基于定位服务数据,生成业务用户的用户地理画像。在其中一个实施例中,业务用户的用户地理画像包括:家庭位置、工作单位位置、通勤距离、工作城市、居住地城市、是否跨地工作、籍贯、是否外来务工、节假日常去城市、是否周末宅、是否有房和工作性质中的至少一种。在其中一个实施例中,在获取业务用户的定位服务数据之后,还包括:从定位服务数据中提取区域外坐标;当确定区域外坐标为颠倒坐标时,对区域外坐标进行经纬度置换处理,得到置换处理后的置换坐标;将置换坐标添加至定位服务数据中,将更新后的定位服务数据作为定位服务数据。一种用户地理画像生成装置,所述装置包括:用户数据获取模块,用于获取业务用户的定位服务数据;数据簇获得模块,用于通过基于密度的聚类算法,对定位服务数据进行密度聚类处理,得到定位服务数据的数据簇;基准位置簇确定模块,用于从数据簇中,确定业务用户的地理画像基准位置所属的基准位置簇;其中,地理画像基准位置包括进行用户地理画像生成时的参考位置;簇中心确定模块,用于对基准位置簇进行聚类处理,得到基准位置簇的簇中心;地理画像生产模块,用于基于簇中心和定位服务数据,生成业务用户的用户地理画像。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取业务用户的定位服务数据;通过基于密度的聚类算法,对定位服务数据进行密度聚类处理,得到定位服务数据的数据簇;从数据簇中,确定业务用户的地理画像基准位置所属的基准位置簇;其中,地理画像基准位置包括进行用户地理画像生成时的参考位置;对基准位置簇进行聚类处理,得到基准位置簇的簇中心;基于簇中心和定位服务数据,生成业务用户的用户地理画像。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取业务用户的定位服务数据;通过基于密度的聚类算法,对定位服务数据进行密度聚类处理,得到定位服务数据的数据簇;从数据簇中,确定业务用户的地理画像基准位置所属的基准位置簇;其中,地理画像基准位置包括进行用户地理画像生成时的参考位置;对基准位置簇进行聚类处理,得到基准位置簇的簇中心;基于簇中心和定位服务数据,生成业务用户的用户地理画像。上述用户地理画像生成方法、装置、计算机设备和存储介质,通过基于密度的聚类算法对定位服务数据进行密度聚类处理,再从得到的数据簇中,确定业务用户的地理画像基准位置所属的基准位置簇,有效利用了定位服务数据的密度分布特点,确保了基准位置簇的准确性;再基于基准位置簇进行聚类处理得到的簇中心和定位服务数据,生成业务用户的用户地理画像,提高了用户地理画像的准确性。附图说明图1为一个实施例中用户地理画像生成方法的应用场景图;图2为一个实施例中用户地理画像生成方法的流程示意图;图3为一个实施例中数据簇获取的流程示意图;图4为一个实施例中用户地理画像生成装置的结构框图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的用户地理画像生成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102将业务用户的定位服务数据发送至服务器104,服务器104通过基于密度的聚类算法对获得的定位服务数据进行密度聚类处理,再从得到的数据簇中,确定业务用户的地理画像基准位置所属的基准位置簇,再基于基准位置簇进行聚类处理得到的簇中心和定位服务数据,生成业务用户的用户地理画像。此外,业务用户的定位服务数据可以存储在服务器104的本地缓存中,则服务器104可以直接从本地缓存中获得业务用户的定位服务数据,以进行后续用户地理画像生成处理;还可以由终端102直接对业务用户的定位服务数本文档来自技高网...

【技术保护点】
1.一种用户地理画像生成方法,所述方法包括:/n获取业务用户的定位服务数据;/n通过基于密度的聚类算法,对所述定位服务数据进行密度聚类处理,得到所述定位服务数据的数据簇;/n从所述数据簇中,确定所述业务用户的地理画像基准位置所属的基准位置簇;其中,所述地理画像基准位置包括进行用户地理画像生成时的参考位置;/n对所述基准位置簇进行聚类处理,得到所述基准位置簇的簇中心;/n基于所述簇中心和所述定位服务数据,生成所述业务用户的用户地理画像。/n

【技术特征摘要】
1.一种用户地理画像生成方法,所述方法包括:
获取业务用户的定位服务数据;
通过基于密度的聚类算法,对所述定位服务数据进行密度聚类处理,得到所述定位服务数据的数据簇;
从所述数据簇中,确定所述业务用户的地理画像基准位置所属的基准位置簇;其中,所述地理画像基准位置包括进行用户地理画像生成时的参考位置;
对所述基准位置簇进行聚类处理,得到所述基准位置簇的簇中心;
基于所述簇中心和所述定位服务数据,生成所述业务用户的用户地理画像。


2.根据权利要求1所述的方法,其特征在于,所述通过基于密度的聚类算法,对所述定位服务数据进行密度聚类处理,得到所述定位服务数据的数据簇包括:
获取预设的核心点覆盖半径和核心点覆盖数目阈值;
按照所述核心点覆盖半径和所述核心点覆盖数目阈值,通过DBSCAN算法对所述定位服务数据进行聚类迭代处理,得到所述定位服务数据的核心点;
对各所述核心点进行聚类迭代处理,得到由所述核心点组成的所述定位服务数据的数据簇。


3.根据权利要求2所述的方法,其特征在于,所述对各所述核心点进行聚类迭代处理,得到由所述核心点组成的所述定位服务数据的数据簇包括:
获取预设的核心点组合距离阈值;
按照所述核心点组合距离阈值,通过DBSCAN算法对各所述核心点进行聚类迭代处理,得到由所述核心点组成的所述定位服务数据的数据簇。


4.根据权利要求1所述的方法,其特征在于,所述地理画像基准位置包括家庭地址和工作地址;所述从所述数据簇中,确定所述业务用户的地理画像基准位置所属的基准位置簇包括:
确定所述数据簇中所述定位服务数据的数目及所述定位服务数据的时段分布;
根据所述数据簇中所述定位服务数据的数目和所述时段分布,确定家庭地址所属的家庭地址簇和工作地址所属的工作地址簇;
根据所述家庭地址簇和所述工作地址簇得到基准位置簇。


5.根...

【专利技术属性】
技术研发人员:曹煬
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1