【技术实现步骤摘要】
用户职住地预测方法、装置及存储介质
本专利技术实施例涉及大数据应用
,尤其涉及一种用户职住地预测方法、装置及存储介质。
技术介绍
随着大数据时代的到来,用户数据越来越多,信息量越来越大,如何有效利用用户数据获取更为精准更有价值的数据信息,并将得到的有价值的数据信息通过有效标签化的展示方式呈现,进而建立精准用户画像,是现在大数据领域所面临的问题。挖掘用户的职住地,一直是用户画像领域的技术难度,准确率很难达到可用水平。比如在金融风控方面,用户的工作地代表其收入水平、工作稳定性,对评估用户的信用水平、合理授信有巨大的价值。又比如,在互联网信息流产品中,如果知道用户的工作地和居住地,就能推测出用户属性以及兴趣爱好,对提升信息推荐算法收益巨大。目前现有技术中,对于用户职住地的挖掘,传统的做法是基于用户的定位轨迹数据进行简单聚类,对用户定位簇点时序关系进行分析识别出用户职住地。但由于聚类结果数据噪声较多,这些标签的准确率不高。
技术实现思路
本专利技术提供的用户职住地预测方法、装置及存储介质,基 ...
【技术保护点】
1.一种用户职住地预测方法,其特征在于,包括:/n获取第一用户的定位基础数据;/n根据所述定位基础数据确定所述第一用户的驻留簇点;/n获取所述驻留簇点对应的网络连接特征数据;/n将所述网络连接特征数据输入到用户职住地预测模型中,得到所述第一用户职住地的预测结果。/n
【技术特征摘要】
1.一种用户职住地预测方法,其特征在于,包括:
获取第一用户的定位基础数据;
根据所述定位基础数据确定所述第一用户的驻留簇点;
获取所述驻留簇点对应的网络连接特征数据;
将所述网络连接特征数据输入到用户职住地预测模型中,得到所述第一用户职住地的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述定位基础数据确定所述第一用户的驻留簇点,包括:
对所述定位基础数据进行数据预处理,得到所述第一用户的定位轨迹数据;
根据所述定位轨迹数据确定所述第一用户的驻留簇点。
3.根据权利要求2所述的方法,其特征在于,所述定位轨迹数据包括多个定位点的位置信息以及时间信息;所述根据所述定位轨迹数据确定所述第一用户的驻留簇点,包括:
根据所述多个定位点的位置信息以及时间信息,确定所述多个定位点的速度信息;
根据所述速度信息确定所述第一用户的驻留点;
对所述驻留点进行聚类,得到所述第一用户的驻留簇点。
4.根据权利要求1所述的方法,其特征在于,所述获取所述驻留簇点对应的网络连接特征数据,包括:
获取所述第一用户在所述驻留簇点的网络连接数据;
提取所述网络连接数据的时间分布特征数据;
将所述时间分布特征数据作为所述网络连接特征数据。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述用户职住地预测模型的创建过程,包括:
获取多个用户的定位基础数据,对所述定位基础数据进行预处理,得到所述多个用户的定位轨迹数据;
根据所述定位轨迹数据确定所...
【专利技术属性】
技术研发人员:尤国安,彭继东,杨敬,陈程,杨胜文,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。