职业预测方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:24251569 阅读:52 留言:0更新日期:2020-05-22 23:35
本发明专利技术提供一种职业预测方法、装置、设备及计算机可读存储介质,方法包括:获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。从而能够准确地对当前全部用户的职业进行预测,以便后续根据用户的职业标签进行大数据分析。

Career prediction methods, devices, equipment and computer-readable storage media

【技术实现步骤摘要】
职业预测方法、装置、设备及计算机可读存储介质
本专利技术涉及数据处理领域,尤其涉及一种职业预测方法、装置、设备及计算机可读存储介质。
技术介绍
大数据技术是以任何系统的全部数据资源为对象并从中发现数据之间表现的相关性关系的信息处理技术,目前已经广泛应用于互联网的流程优化、目标化消息及广告推送、用户个性化服务与改善等方面,成为了网络服务背后强大的后台支撑。用户画像是大数据技术的重要应用,其目标是在很多的维度上建立针对用户的描述性标签属性,从而利用这些标签属性对用户多方面的真实个人特征进行勾勒。其中,用户的职业标签即为用户画像中的一项,如何实现对用户职业标签的推测即成为了亟待解决的问题。现有技术中一般都通过预设的职业预测算法实现对用户职业的预测,但是,现有的职业预测算法往往存在召回率不高且预测不够准确的问题,召回率不高即产品中只有少部分的用户可以推断出职业。
技术实现思路
本专利技术提供一种职业预测方法、装置、设备及计算机可读存储介质,用于解决现有技术中通过职业预测算法实现用户职业的预测导致召回率不高且预测不够准确的技术问题。本专利技术的第一个方面是提供一种职业预测方法,包括:获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。本专利技术的另一个方面是提供一种职业预测装置,包括:地址信息获取模块,用于获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;聚类模块,用于对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;绘制模块,用于根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;预测模块,用于根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。本专利技术的又一个方面是提供一种职业预测设备,包括:存储器,处理器;存储器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为由所述处理器执行如上述的职业预测方法。本专利技术的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的职业预测方法。本专利技术提供的职业预测方法、装置、设备及计算机可读存储介质,通过获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。从而能够准确地对当前全部用户的职业进行预测,以便后续根据用户的职业标签进行大数据分析。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本专利技术基于的网络架构示意图;图2为本专利技术实施例一提供的职业预测方法的流程示意图;图3为本专利技术实施例提供的目标定位点拓扑图的架构图;图4为本专利技术实施例二提供的职业预测方法的流程示意图;图5为本专利技术实施例三提供的职业预测方法的流程示意图;图6为本专利技术实施例四提供的职业预测方法的流程示意图;图7为本专利技术又一实施例提供的目标定位点拓扑图的架构图;图8为本专利技术实施例五提供的职业预测装置的结构示意图;图9为本专利技术实施例六提供的职业预测设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例所获得的所有其他实施例,都属于本专利技术保护的范围。现有技术中一般都通过预设的职业预测算法实现对用户职业的预测,但是,现有的职业预测算法往往存在召回率不高且预测不够准确的问题,召回率不高即产品中只有少部分的用户可以推断出职业。为了解决上述技术问题,本专利技术提供了一种职业预测方法、装置、设备及计算机可读存储介质。需要说明的是,本申请提供职业预测方法、装置、设备及计算机可读存储介质可运用在任意一种对用户职业预测的场景中的场景中。图1为本专利技术基于的网络架构示意图,如图1所示,本专利技术基于的网络架构至少包括:职业预测装置1、数据平台2。其中,职业预测装置1可以由软件和/或硬件的方式实现,当其采用软件实现时,其可以采用C/C++、Java、Shell或Python等语言编写;数据平台2可以为云端服务器或服务器集群,其内存储有大量的数据。需要说明的是,职业预测装置1能够与数据平台2进行通信,实现数据交互。图2为本专利技术实施例一提供的职业预测方法的流程示意图,图3为本专利技术实施例提供的目标定位点拓扑图的架构图,在上述实施例的基础上,如图2-图3所示,所述方法包括:步骤101、获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户。本实施例的执行主体为职业预测装置,职业预测装置能够与数据平台进行通信,实现数据交互。为了实现对用户职业的预测,首先可以与数据平台进行数据交互,从数据平台中获取多个用户的多个地址信息,其中,该用户可以为职业待测的第一用户以及职业已知的第二用户,从而能够根据职业已知的第二用户以及地址信息对第一用户的职业进行预测。举例来说,数据平台可以为应用软件的数据库,例如滴滴以及淘宝等,用户在使用应用软件的过程中,会产生使用数据,使用数据中可以包括多个地址信息,因此,可以从数据平台中实现对用户地址信息的获取。需要说明的是,地址信息可以以经纬度的方式进行表示。步骤102、对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点。在本实施方式中,由于用户的地址信息有多个,多个地址信息往往分布的较为分散,因此,为了能够根据用户的地址信息实现对用户的职业预测,获取预存的至少一个用户的多个地址信息之后,需要对分散的地址信息进行聚类操作,获得每一个用户的目标定位点。步骤103、根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘本文档来自技高网...

【技术保护点】
1.一种职业预测方法,其特征在于,包括:/n获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;/n对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;/n根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;/n根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。/n

【技术特征摘要】
1.一种职业预测方法,其特征在于,包括:
获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;
对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;
根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;
根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。


2.根据权利要求1所述的方法,其特征在于,所述对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点,包括:
针对每一所述用户,通过预设的编码算法分别对所述用户多个地址信息进行编码,获得多个与所述地址信息对应的编码信息;
针对每一编码信息,确定所述编码信息对应的全部地址信息;
根据所述编码信息对应的全部地址信息确定所述目标定位点。


3.根据权利要求2所述的方法,其特征在于,所述根据所述编码信息对应的全部地址信息确定所述目标定位点,包括:
判断所述编码信息对应的全部地址信息与所述用户的多个地址信息的比值是否大于预设的第一阈值;
若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点;
若否,则不对所述用户进行职业预测。


4.根据权利要求3所述的方法,其特征在于,所述若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点之后,还包括:
确定所述目标定位点的数量是否大于预设的第二阈值;
若是,则根据预设的筛选规则对所述目标定位点进行筛选。


5.根据权利要求4所述的方法,其特征在于,所述根据预设的筛选规则对所述目标定位点进行筛选,包括:
针对各目标定位点,确定用户出现在所述目标定位点的时间信息,根据所述时间信息对所述目标定位点进行筛选;和/或,
针对各目标定位点,确定所述目标定位点附近的建筑类型,根据所述建筑类型对所述目标定位点进行筛选。


6.根据权利要求1所述的方法,其特征在于,所述根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图,包括:
针对各目标定位点,将所述目标定位点分别和与所述目标定位点距离小于预设的第三阈值的其他目标定位点建立边连接线;
针对每一条边连接线,计算所述边连接线两端的目标定位点之间的距离,对所述距离进行归一化,将归一化后的距离作为所述边连接线对应的边权重,根据点权重、边权重以及目标定位点绘制目标定位点拓扑图。


7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测,包括:
针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点;
将所述第二用户目标定位点的点权重以及与其相连接全部第一用户的目标定位点的边连接线的边权重相乘,获得与所述第二用户目标定位点相连接的全部第一用户的目标定位点的点权重;
将所述与所述第二用户目标定位点相连接的全部第一用户的目标定位点作为所述第二用户的目标定位点,返回执行针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点的步骤,直至所述网络定位点拓扑图中的全部用户的职业都预测完毕,获得全部用户的目标定位点的点权重;
对所述全部第一用户的目标定位点的点权重进行归一化,获得所述全部第一用户的第一职业比例。


8.根据权利要求7所述的方法,其特征在于,所述对所述全部第一用户的目标定位点的点权重进行归一化,获得所述全部第一用户的第一职业比例之后,还包括:
针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重;
对所述本轮迭代运算对应的全部用户目标定位点的点权重进行归一化,获得所述全部第一用户的第二职业比例;
判断所述第一职业比例与所述第二职业比例的差值是否大于预设的差值阈值,若是,则返回执行针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重的步骤,直至所述第一职业比例与所述第二职业比例的差值不大于所述预设的差值阈值。


9.根据权利要求1-6、8任一项所述的方法,其特征在于,所述用户的地址信息包括用户使用网约车的定位点地址、出发点地址以及目的地地址和/或用户网络购物的收货地址和/或用户外卖的收货地址。


10.一种职业预测装置,其特征在于,包括:
地址信息获取模块,用于获取预存的至少一个用户的多个地址信息,所述用户...

【专利技术属性】
技术研发人员:卫驰
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1