用户工作单位的挖掘处理方法、装置及电子设备制造方法及图纸

技术编号:23212858 阅读:40 留言:0更新日期:2020-01-31 21:54
本发明专利技术实施例提供一种用户工作单位的挖掘处理方法、装置及电子设备,所述方法包括:根据用户的历史定位数据,得到所述用户的第一工作单位信息;根据所述用户的网络接入情况,得到所述用户的第二工作单位信息;对所述第一工作单位信息和所述第二工作单位信息进行加权融合,确定所述用户的工作单位。该方法不仅同时基于多路线索来确定用户的工作单位,并且考虑了每种路线的准确度权值,从而使得所得出的用户的工作单位的准确性得到极大提升。

Mining processing method, device and electronic equipment of user's work unit

【技术实现步骤摘要】
用户工作单位的挖掘处理方法、装置及电子设备
本专利技术实施例涉及计算机技术,尤其涉及一种用户工作单位的挖掘处理方法、装置及电子设备。
技术介绍
随着互联网技术的不断发展,用户可以通过互联网完成各种各样的操作,以满足自身各种各样的需求。通过挖掘海量用户在互联网上的海量数据并进行数据分析,可以得到大量有价值的用户信息,这些信息在企业营销、企业风控以及个人风控等各领域都具有重要的价值。其中,用户数据挖掘例如可以是挖掘用户的工作单位。现有技术中,可以基于用户的位置信息确定用户的工作单位。例如,统计用户在工作时间段内所处的位置,根据所统计出的位置信息确定用户的工作单位。但是,使用现有技术无法保证得出的用户的工作单位的准确性。
技术实现思路
本专利技术实施例提供一种用户工作单位的挖掘处理方法、装置及电子设备,用于提升用户工作单位挖掘时的准确度。本专利技术实施例第一方面提供一种用户工作单位的挖掘处理方法,所述用户工作单位用于互联网应用,所述方法包括:根据用户的历史定位数据,得到所述用户的第一工作单位信息;根据所述用本文档来自技高网...

【技术保护点】
1.一种用户工作单位的挖掘处理方法,其特征在于,所述用户工作单位用于互联网应用,所述方法包括:/n根据用户的历史定位数据,得到所述用户的第一工作单位信息;/n根据所述用户的网络接入情况,得到所述用户的第二工作单位信息;/n对所述第一工作单位信息和所述第二工作单位信息进行加权融合,确定所述用户的工作单位。/n

【技术特征摘要】
1.一种用户工作单位的挖掘处理方法,其特征在于,所述用户工作单位用于互联网应用,所述方法包括:
根据用户的历史定位数据,得到所述用户的第一工作单位信息;
根据所述用户的网络接入情况,得到所述用户的第二工作单位信息;
对所述第一工作单位信息和所述第二工作单位信息进行加权融合,确定所述用户的工作单位。


2.根据权利要求1所述的方法,其特征在于,所述根据用户的历史定位数据,得到所述用户的第一工作单位信息,包括:
获取所述用户的历史定位数据,所述历史定位数据包含用户在一位置上逗留的时长、日内时段分布以及频次;
将所述用户的历史定位数据输入到预先建立的用户工作地模型中,得到所述用户的第一工作单位的坐标;
将所述第一工作单位的坐标与单位区域地理围栏数据进行匹配,得到所述用户的第一工作单位信息,其中,所述单位区域地理围栏代表单位所在区域边界。


3.根据权利要求2所述的方法,其特征在于,所述将所述用户的历史定位数据输入到预先建立的用户工作地模型中之前,还包括:
获取网络用户的历史定位数据,并收集工作地位置数据;
对所述历史定位数据进行聚类,得到至少两个用户位置簇;
以所述工作地位置数据为样本,并以网络用户在所述至少两个用户位置簇上停留的时长、日内时段分布以及频次作为特征,建立所述用户工作地模型。


4.根据权利要求1所述的方法,其特征在于,所述根据所述用户的网络接入情况,得到所述用户的第二工作单位信息,包括:
获取所述用户的无线保真WIFI接入历史数据,所述WIFI接入历史数据包括所接入的WIFI的标识、接入时间、接入时长,接入频次以及WIFI所处位置;
针对所接入的各个WIFI,根据所述WIFI接入历史数据确定所接入的WIFI中所包含的工作WIFI;
根据所接入的工作WIFI的标识,以及工作WIFI与工作单位信息之间的映射关系,确定所述所接入的工作WIFI所对应的工作单位信息。


5.根据权利要求4所述的方法,其特征在于,所述根据所述WIFI接入历史数据确定所接入的WIFI中所包含的工作WIFI,包括:
将所述WIFI接入历史数据输入到预先建立的WIFI分类模型中,得到各WIFI是否是工作WIFI的分类结果。


6.根据权利要求5所述的方法,其特征在于,所述将所述WIFI接入历史数据输入到预先建立的WIFI分类模型之前,还包括:
收集用户所属单位以及用户接入WIFI的信息;
根据所收集到的信息,建立工作WIFI样本;
根据WIFI的用户接入行为数据以及所述WIFI周边环境信息,提取所述WIFI的特征,并根据所述WIFI的特征建立WIFI分类模型。


7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述用户的网络接入情况,得到所述用户的第二工作单位信息,包括:
根据多个用户访问同一IP地址的IP接入历史数据,确定用户群;
根据所述用户群所接入的WIFI,确定所述用户群中的用户的第二工作单位信息。


8.根据权利要求7所述的方法,其特征在于,所述根据多个用户访问同一IP地址的IP接入历史数据,确定用户群,包括:
针对不同行政区划以及不同IP类型,统计多个用户在预设时间间隔内访问同一IP的行为次数;
针对每个行政区划以及每种IP类型,分别建立以用户为顶点的无向图,其中,顶点之间的权重为两个用户在预设时间范围内访问同一IP的行为次数;
对所述无向图进行聚类,得到聚类后的用户群。


9.根据权利要求8所述的方法,其特征在于,所述根据所述用户群所接入的WIFI,确定所述用户群中的用户的第二工作单位信息,包括:
收集所述用户群中各用户所接入的WIFI信息;
从所述WIFI信息中选择与所述用户群关联度最高的WIFI;
若所述关联度最高的WIFI为工作WIFI,则根据所接入的工作WIFI的标识,以及工作WIFI与工作单位信息之间的映射关系,确定所述所接入的工作WIFI所对应的工作单位信息。


10.根据权利要求7所述的方法,其特征在于,所述对所述第一工作单位信息和所述第二工作单位信息进行加权融合,确定所述用户的工作单位,包括:
将所述第一工作单位信息的打分结果和对应的加权值进行乘积,得到所述第一工作单位信息的得分;
将所述第二工作单位信息的打分结果和对应的加权值进行乘积,得到所述第二工作单位信息的得分;
对所述第一工作单位信息的得分以及所述第二工作单位信息的得分进行由高到底排序;
确定得分最高的工作单位信息对应的工作单位为所述用户的工作单位,或者,确定得分排序前N个工作单位信息分别对应的工作单位为所述用户的工作单位,其中,N为大于零的整数。
...

【专利技术属性】
技术研发人员:杨敬彭继东杨胜文
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1