一种基于移动MAC的身份关系分析方法和系统技术方案

技术编号:15616829 阅读:52 留言:0更新日期:2017-06-14 03:34
本发明专利技术涉及一种基于移动MAC的身份关系分析方法和系统,其中方法包括以下步骤:从网络日志文件中提取人物的多个身份数据,并通过身份数据的优先级来确定所述多个身份数据之间的位置以获得身份关系数据,其中所述多个身份数据包括移动设备MAC,且移动设备MAC具有最高优先级;将人物的多个身份数据及身份关系数据按照有向边的方式存储为图数据,以人物的移动设备MAC为起点遍历出最大的子图得到人物的画像,其中每个子图仅有一个移动设备MAC。本发明专利技术利用海量的网络日志文件,从中提取人物的身份数据,并按照优先级确定身份关系数据,以有向边存储为图数据后以移动设备MAC为主体构建出人物的画像,或者进一步分析出人物之间的关系。

【技术实现步骤摘要】
一种基于移动MAC的身份关系分析方法和系统
本专利技术涉及互联网技术,更具体地说,涉及一种基于移动MAC的身份关系分析方法和系统。
技术介绍
传统的人物身份关系是以身份证作为人物主体来构建的。随着移动互联网迅速发展,手机已经普及,用户通过手机实施的网络行为越来越频繁。为了保障网络安全或者满足客户定制服务的需求,有必要基于网络获取的身份信息建立人物身份关系。然而,目前并没有一种有效的方法能够利用日益膨胀的网络日志来建立人物身份信息。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术中缺乏针对移动互联网的身份关系分析方法的缺陷,提供一种基于移动MAC的身份关系分析方法和系统,能够从海量的用户网络日志文件中提取身份信息,并构建身份关系。本专利技术解决其技术问题所采用的技术方案是:构造一种基于移动MAC的身份关系分析方法,包括以下步骤:S1、从网络日志文件中提取人物的多个身份数据,并通过身份数据的优先级来确定所述多个身份数据之间的位置以获得身份关系数据,其中所述多个身份数据包括移动设备MAC,且所述移动设备MAC具有最高优先级;S2、将所述人物的多个身份数据及身份关系数据按照有向边的方式存储为图数据,以人物的移动设备MAC为起点遍历出最大的子图得到人物的画像,其中每个子图中仅含有一个移动设备MAC。在根据本专利技术所述的基于移动MAC的身份关系分析方法中,还包括以下步骤:S3、检测人物的子图是否有交集,根据检测的结果判断人物画像之间的朋友关系。在根据本专利技术所述的基于移动MAC的身份关系分析方法中,还包括在步骤S1之前执行的:S0、接收并通过清洗程序实时处理网络日志文件,将有效的数据推送到分布式消息队列。在根据本专利技术所述的基于移动MAC的身份关系分析方法中,所述步骤S1进一步包括:S11、从网络日志文件中抽取人物的多个身份数据;随后并发执行步骤S12和步骤S13;S12、通过内存实现身份数据的局部排重,随后通过分布式缓存服务实现身份数据全局排重;最后将身份数据持久化到分布式文件系统;S13、通过身份数据的优先级来确定所述多个身份数据之间的位置以获得身份关系数据;随后通过内存实现身份关系数据的局部排重,并通过分布式缓存服务实现身份关系数据全局排重;最后将身份关系数据持久化到分布式文件系统。在根据本专利技术所述的基于移动MAC的身份关系分析方法中,所述步骤S2进一步包括:S21、加载分布式文件系统的数据,将其中身份数据加载为图的顶点,身份关系数据加载为图的边,其中含有移动设备MAC的身份关系数据加载为一条边,未含有移动设备MAC的身份关系数据扩展为两条边,并通过顶点集合和边集合初始化总图;S22、通过移动设备MAC的出度过滤问题数据,以每个移动设备MAC为起点,遍历出最大的子图得到人物的画像,其中每个子图中仅含有一个移动设备MAC;S23、将身份数据和身份关系数据持久化,并通过关系转化和权重转化将图数据简化,其中所述关系转化将身份关系数据的间接关系转化为直接关系,所述权重转化首先算出子图的最大层级n,并通过以下公式计算新权重:其中Gk表示第k级的权重。本专利技术还提供了一种基于移动MAC的身份关系分析系统,包括:身份提取模块,用于从网络日志文件中提取人物的多个身份数据,并通过身份数据的优先级来确定所述多个身份数据之间的位置以获得身份关系数据,其中所述多个身份数据包括移动设备MAC,且所述移动设备MAC具有最高优先级;画像构建模块,用于将所述人物的多个身份数据及身份关系数据按照有向边的方式存储为图数据,并以人物的移动设备MAC为起点遍历出最大的子图得到人物的画像,其中每个子图中仅含有一个移动设备MAC。在根据本专利技术所述的基于移动MAC的身份关系分析系统中,所述系统还包括:人物关系分析模块,用于检测人物的子图是否有交集,根据检测的结果判断人物画像之间的朋友关系。在根据本专利技术所述的基于移动MAC的身份关系分析系统中,所述系统还包括:日志接收模块,用于接收并通过清洗程序实时处理网络日志文件,将有效的数据推送到分布式消息队列,提供给所述身份提取模块。在根据本专利技术所述的基于移动MAC的身份关系分析系统中,所述身份提取模块进一步包括:身份数据提取单元,用于从网络日志文件中抽取人物的多个身份数据;身份数据处理单元,用于通过内存实现身份数据的局部排重,随后通过分布式缓存服务实现身份数据全局排重;最后将身份数据持久化到分布式文件系统;身份关系数据处理单元,用于通过身份数据的优先级来确定所述多个身份数据之间的位置以获得身份关系数据;随后通过内存实现身份关系数据的局部排重,并通过分布式缓存服务实现身份关系数据全局排重;最后将身份关系数据持久化到分布式文件系统。在根据本专利技术所述的基于移动MAC的身份关系分析系统中,所述画像构建模块进一步包括:数据加载单元,用于加载分布式文件系统的数据,将其中身份数据加载为图的顶点,身份关系数据加载为图的边,其中含有移动设备MAC的身份关系数据加载为一条边,未含有移动设备MAC的身份关系数据扩展为两条边,并通过顶点集合和边集合初始化总图;画像构建单元,用于通过移动设备MAC的出度过滤问题数据,以每个移动设备MAC为起点,遍历出最大的子图得到人物的画像,其中每个子图中仅含有一个移动设备MAC;数据简化单元,将身份数据和身份关系数据持久化,并通过关系转化和权重转化将图数据简化,其中所述关系转化将身份关系数据的间接关系转化为直接关系,所述权重转化首先算出子图的最大层级n,并通过以下公式计算新权重:其中Gk表示第k级的权重。实施本专利技术的基于移动MAC的身份关系分析方法和系统,具有以下有益效果:本专利技术利用海量的网络日志文件,从中提取人物的身份数据,并按照优先级确定身份关系数据,以有向边存储为图数据后以移动设备MAC为主体构建出人物的画像,或者进一步分析出人物之间的关系。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1为根据本专利技术基于移动MAC的身份关系分析方法的第一实施例的流程图;图2为根据本专利技术基于移动MAC的身份关系分析方法的第二实施例的流程图;图3为根据本专利技术基于移动MAC的身份关系分析方法中身份提取步骤的具体流程图;图4为根据本专利技术基于移动MAC的身份关系分析方法中画像构建步骤的具体流程图;图5为根据本专利技术基于移动MAC的身份关系分析系统的第一实施例的框图;图6为根据本专利技术基于移动MAC的身份关系分析系统的第二实施例的框图;图7为根据本专利技术基于移动MAC的身份关系分析方法中身份提取模块的具体框图;图8为根据本专利技术基于移动MAC的身份关系分析系统中画像构建模块的具体框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。请参阅图1,为根据本专利技术基于移动MAC的身份关系分析方法的第一实施例的流程图。该实施例提供的基于移动MAC的身份关系分析方法主要包括以下步骤:首先,在步骤S1中执行身份提取步骤,从网络日志文件中提取人物的多个身份数据,并通过身份数据的优先级来确定前述多个身份数据之间的位置以获得身份关系数据,其中前述多个身份数据包括移动设备MAC即移动设备物理地址,且该移动设备MAC具有最高优先级。在本专利技术的优选实施例中,前述身本文档来自技高网...
一种基于移动MAC的身份关系分析方法和系统

【技术保护点】
一种基于移动MAC的身份关系分析方法,其特征在于,包括以下步骤:S1、从网络日志文件中提取人物的多个身份数据,并通过身份数据的优先级来确定所述多个身份数据之间的位置以获得身份关系数据,其中所述多个身份数据包括移动设备MAC,且所述移动设备MAC具有最高优先级;S2、将所述人物的多个身份数据及身份关系数据按照有向边的方式存储为图数据,以人物的移动设备MAC为起点遍历出最大的子图得到人物的画像,其中每个子图中仅含有一个移动设备MAC。

【技术特征摘要】
1.一种基于移动MAC的身份关系分析方法,其特征在于,包括以下步骤:S1、从网络日志文件中提取人物的多个身份数据,并通过身份数据的优先级来确定所述多个身份数据之间的位置以获得身份关系数据,其中所述多个身份数据包括移动设备MAC,且所述移动设备MAC具有最高优先级;S2、将所述人物的多个身份数据及身份关系数据按照有向边的方式存储为图数据,以人物的移动设备MAC为起点遍历出最大的子图得到人物的画像,其中每个子图中仅含有一个移动设备MAC。2.根据权利要求1所述的基于移动MAC的身份关系分析方法,其特征在于,所述方法还包括以下步骤:S3、检测人物的子图是否有交集,根据检测的结果判断人物画像之间的朋友关系。3.根据权利要求1所述的基于移动MAC的身份关系分析方法,其特征在于,所述方法还包括在步骤S1之前执行的:S0、接收并通过清洗程序实时处理网络日志文件,将有效的数据推送到分布式消息队列。4.根据权利要求1所述的基于移动MAC的身份关系分析方法,其特征在于,所述步骤S1进一步包括:S11、从网络日志文件中抽取人物的多个身份数据;随后并发执行步骤S12和步骤S13;S12、通过内存实现身份数据的局部排重,随后通过分布式缓存服务实现身份数据全局排重;最后将身份数据持久化到分布式文件系统;S13、通过身份数据的优先级来确定所述多个身份数据之间的位置以获得身份关系数据;随后通过内存实现身份关系数据的局部排重,并通过分布式缓存服务实现身份关系数据全局排重;最后将身份关系数据持久化到分布式文件系统。5.根据权利要求4所述的基于移动MAC的身份关系分析方法,其特征在于,所述步骤S2进一步包括:S21、加载分布式文件系统的数据,将其中身份数据加载为图的顶点,身份关系数据加载为图的边,其中含有移动设备MAC的身份关系数据加载为一条边,未含有移动设备MAC的身份关系数据扩展为两条边,并通过顶点集合和边集合初始化总图;S22、通过移动设备MAC的出度过滤问题数据,以每个移动设备MAC为起点,遍历出最大的子图得到人物的画像,其中每个子图中仅含有一个移动设备MAC;S23、将身份数据和身份关系数据持久化,并通过关系转化和权重转化将图数据简化,其中所述关系转化将身份关系数据的间接关系转化为直接关系,所述权重转化首先算出子图的最大层级n,并通过以下公式计算新权重:其中Gk表示第k级的权重。6.一种基于移动MAC的身份关系分析系统,其特征...

【专利技术属性】
技术研发人员:刘臣胡文鹏张东升景晓军沈智杰唐新民
申请(专利权)人:任子行网络技术股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1