网络用户定位方法、装置及终端制造方法及图纸

技术编号:13674142 阅读:44 留言:0更新日期:2016-09-07 23:16
一种网络用户定位方法、装置及终端,所述网络用户定位方法包括:获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。本发明专利技术技术方案提高了网络用户定位的准确性。

【技术实现步骤摘要】

本专利技术涉及数据挖掘领域,尤其涉及一种网络用户定位方法、装置及终端
技术介绍
随着互联网技术的发展以及大数据领域的不断扩张,互联网用户数据日益剧增。其中,在网络平台,可以统计到互联网用户的数据,用户数据包括用户的年龄、性别、职业等用户信息,则可以通过计算不同性别网民的地域分布,以及年龄、职业、消费能力等地域分布,可以有效的帮助公司和政府做出经济决策或市场定位。现有技术中,确定网络用户的地理位置有以下方式,一种是利用用户上网时的IP地址,根据IP地址可以查到上网用户对应的地理区域,例如,IP地址为[210.22.119.158]对应的地理区域为上海市浦东新区;另一种是通过采集用户上网时的cookie信息,然后从cookie信息中筛选出用户当前的经纬度信息。但是,现有技术中,通过IP地址获取到的用户位置为地理区域,精确性低;而通过cookie信息筛选出的经纬度信息,由于网络互联的复杂多样性,同一个IP会筛选到多个地理位置,用户定位的精准性依然很低。
技术实现思路
本专利技术解决的技术问题是如何提高网络用户定位的准确性。为解决上述技术问题,本专利技术实施例提供一种网络用户定位方法,网络用户定位方法包括:获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。可选的,获取用户的所述网络行为信息之后还包括:过滤所述地理位置。可选的,过滤所述地理位置包括:基于所述IP地址所属的地域范围,剔
除所述地域范围以外的所述地理位置。可选的,所述网络用户定位方法按照设定时间周期性地执行。可选的,所述网络用户定位方法还包括:将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。可选的,所述地理位置采用经纬度的形式表示。可选的,根据所述多个地理位置之间的距离对所述多个地理位置进行聚类包括:形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;计算所述第一集合内的数据点两两之间的距离,为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除所述第一集合内的距离最大的两个数据点;遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。可选的,基于聚类的结果确定所述IP地址的位置信息包括:确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。可选的,对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;基于聚类的结果确定所述IP地址的所述位置信息包括:确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。为解决上述技术问题,本专利技术实施例还公开了一种网络用户定位装置,所述网络用户定位装置包括:采集单元,适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;聚类单元,适于根据
所述多个地理位置之间的距离对所述多个地理位置进行聚类;判定单元,适于基于聚类的结果确定所述IP地址的位置信息。可选的,所述网络用户定位装置还包括:过滤单元,适于在所述采集单元获取所述网络行为信息之后过滤所述地理位置。可选的,所述过滤单元适于基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。可选的,所述网络用户定位装置还包括:控制单元,适于控制所述采集单元、所述聚类单元和所述判定单元周期性地工作。可选的,所述网络用户定位装置还包括:存储单元,适于将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。可选的,所述地理位置采用经纬度的形式表示。可选的,所述聚类单元包括:集合形成子单元,适于形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;距离计算子单元,适于计算所述第一集合内的数据点两两之间的距离,并为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除子单元,适于剔除所述第一集合内的距离最大的两个数据点;遍历子单元,适于遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。可选的,所述判定单元包括:第一确定子单元,确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;第一位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。可选的,所述聚类单元对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;所述判定单元包括:第二确定子单
元,适于确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;第二位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。为解决上述技术问题,本专利技术实施例还公开了一种终端,所述终端包括所述网络用户定位装置。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例的网络用户定位方法通过获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。进一步,所述网络用户定位方法按照设定时间周期性地执行,在提高了网络用户定位的准确性的基础上,可以实现实时获取网络用户的地理位置信息。附图说明图1是本专利技术实施例一种网络用户定位方法的流程图;图2是本专利技术实施例另一种网络用户定位方法的流程图;图3是本专利技术实施例一种地理位置聚类方法的流程图;图4是本专利技术实施例一种网络用户定位装置的结构示意图;图5是本专利技术实施例另一种网络用户定位装置的结构示意图。具体实施方式如
技术介绍
中所述,现有技术中,通过IP地址获取到的用户位置为地理区域,精确性低;而通过cookie信息筛选出的经纬度信息,由于网络互联的复杂多样性,同一个IP会筛选到多个地理位置,用户定位的精准性依然很低。本专利技术实施例中,IP地址是指互联网本文档来自技高网
...

【技术保护点】
一种网络用户定位方法,其特征在于,包括:获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。

【技术特征摘要】
1.一种网络用户定位方法,其特征在于,包括:获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。2.根据权利要求1所述的网络用户定位方法,其特征在于,获取用户的所述网络行为信息之后还包括:过滤所述地理位置。3.根据权利要求2所述的网络用户定位方法,其特征在于,过滤所述地理位置包括:基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。4.根据权利要求1所述的网络用户定位方法,其特征在于,所述网络用户定位方法按照设定时间周期性地执行。5.根据权利要求1所述的网络用户定位方法,其特征在于,还包括:将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。6.根据权利要求1至5任一项所述的网络用户定位方法,其特征在于,所述地理位置采用经纬度的形式表示。7.根据权利要求1所述的网络用户定位方法,其特征在于,根据所述多个地理位置之间的距离对所述多个地理位置进行聚类包括:形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;计算所述第一集合内的数据点两两之间的距离,为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除所述第一集合内的距离最大的两个数据点;遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他
\t数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。8.根据权利要求7所述的网络用户定位方法,其特征在于,基于聚类的结果确定所述IP地址的位置信息包括:确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。9.根据权利要求1所述的网络用户定位方法,其特征在于,对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;基于聚类的结果确定所述IP地址的所述位置信息包括:确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。10.一种网络用户定位装置,其特征在于,包括:采集单元,适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;聚类单元...

【专利技术属性】
技术研发人员:汤奇峰陈兵强
申请(专利权)人:晶赞广告上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1