【技术实现步骤摘要】
职业预测方法、装置、设备及计算机可读存储介质
本专利技术涉及数据处理领域,尤其涉及一种职业预测方法、装置、设备及计算机可读存储介质。
技术介绍
大数据技术是以任何系统的全部数据资源为对象并从中发现数据之间表现的相关性关系的信息处理技术,目前已经广泛应用于互联网的流程优化、目标化消息及广告推送、用户个性化服务与改善等方面,成为了网络服务背后强大的后台支撑。用户画像是大数据技术的重要应用,其目标是在很多的维度上建立针对用户的描述性标签属性,从而利用这些标签属性对用户多方面的真实个人特征进行勾勒。其中,用户的职业标签即为用户画像中的一项,如何实现对用户职业标签的推测即成为了亟待解决的问题。现有技术中一般都通过预设的职业预测算法实现对用户职业的预测,但是,现有的职业预测算法往往存在召回率不高且预测不够准确的问题,召回率不高即产品中只有少部分的用户可以推断出职业。
技术实现思路
本专利技术提供一种职业预测方法、装置、设备及计算机可读存储介质,用于解决现有技术中通过职业预测算法实现用户职业的预测导致召回率不高且预测不够准确的技术问题。本专利技术的第一个方面是提供一种职业预测方法,包括:获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位 ...
【技术保护点】
1.一种职业预测方法,其特征在于,包括:/n获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;/n对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;/n根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;/n根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。/n
【技术特征摘要】
1.一种职业预测方法,其特征在于,包括:
获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;
对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;
根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;
根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。
2.根据权利要求1所述的方法,其特征在于,所述对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点,包括:
针对每一所述用户,通过预设的编码算法分别对所述用户多个地址信息进行编码,获得多个与所述地址信息对应的编码信息;
针对每一编码信息,确定所述编码信息对应的全部地址信息;
根据所述编码信息对应的全部地址信息确定所述目标定位点。
3.根据权利要求2所述的方法,其特征在于,所述根据所述编码信息对应的全部地址信息确定所述目标定位点,包括:
判断所述编码信息对应的全部地址信息与所述用户的多个地址信息的比值是否大于预设的第一阈值;
若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点;
若否,则不对所述用户进行职业预测。
4.根据权利要求3所述的方法,其特征在于,所述若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点之后,还包括:
确定所述目标定位点的数量是否大于预设的第二阈值;
若是,则根据预设的筛选规则对所述目标定位点进行筛选。
5.根据权利要求4所述的方法,其特征在于,所述根据预设的筛选规则对所述目标定位点进行筛选,包括:
针对各目标定位点,确定用户出现在所述目标定位点的时间信息,根据所述时间信息对所述目标定位点进行筛选;和/或,
针对各目标定位点,确定所述目标定位点附近的建筑类型,根据所述建筑类型对所述目标定位点进行筛选。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图,包括:
针对各目标定位点,将所述目标定位点分别和与所述目标定位点距离小于预设的第三阈值的其他目标定位点建立边连接线;
针对每一条边连接线,计算所述边连接线两端的目标定位点之间的距离,对所述距离进行归一化,将归一化后的距离作为所述边连接线对应的边权重,根据点权重、边权重以及目标定位点绘制目标定位点拓扑图。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测,包括:
针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点;
将所述第二用户目标定位点的点权重以及与其相连接全部第一用户的目标定位点的边连接线的边权重相乘,获得与所述第二用户目标定位点相连接的全部第一用户的目标定位点的点权重;
将所述与所述第二用户目标定位点相连接的全部第一用户的目标定位点作为所述第二用户的目标定位点,返回执行针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点的步骤,直至所述网络定位点拓扑图中的全部用户的职业都预测完毕,获得全部用户的目标定位点的点权重;
对所述全部第一用户的目标定位点的点权重进行归一化,获得所述全部第一用户的第一职业比例。
8.根据权利要求7所述的方法,其特征在于,所述对所述全部第一用户的目标定位点的点权重进行归一化,获得所述全部第一用户的第一职业比例之后,还包括:
针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重;
对所述本轮迭代运算对应的全部用户目标定位点的点权重进行归一化,获得所述全部第一用户的第二职业比例;
判断所述第一职业比例与所述第二职业比例的差值是否大于预设的差值阈值,若是,则返回执行针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重的步骤,直至所述第一职业比例与所述第二职业比例的差值不大于所述预设的差值阈值。
9.根据权利要求1-6、8任一项所述的方法,其特征在于,所述用户的地址信息包括用户使用网约车的定位点地址、出发点地址以及目的地地址和/或用户网络购物的收货地址和/或用户外卖的收货地址。
10.一种职业预测装置,其特征在于,包括:
地址信息获取模块,用于获取预存的至少一个用户的多个地址信息,所述用户...
【专利技术属性】
技术研发人员:卫驰,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。