一种上网行为轨迹还原的方法和装置制造方法及图纸

技术编号:14866206 阅读:69 留言:0更新日期:2017-03-20 13:38
本发明专利技术提出了一种上网行为轨迹还原的方法和装置,该方法,包括:针对具备已知互联网账号的虚拟用户,在互联网中挖掘出所述虚拟用户的其他互联网账号;在待测时间段内,在互联网中获取符合条件的待测数据包,所述符合条件的待测数据包至少包含有所述虚拟用户的任一互联网账号;提取每个所述待测数据包中的所述虚拟用户的互联网账号和所述虚拟用户的互联网账号的特征信息;将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户的互联网账号的特征信息集合;将所述虚拟用户的所有互联网账号的特征信息集合构成所述虚拟用户的上网行为集合;根据所述上网行为集合,按照时间顺序显示出所述虚拟用户通过不同互联网账号上网的上网行为。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种上网行为轨迹还原的方法和装置
技术介绍
随着计算机的普及和互联网络的快速发展,互联网提供了种类繁多的应用,包括电子商务、社区论坛、网络交友、即时聊天和邮箱服务等,用户通过各种邮箱服务收发邮件、通过各类社交软件发布信息等都会形成上网行为数据。基于互联网用户的庞大基数及网络为用户提供的丰富应用服务,在短时间内会迅速地积累海量的上网行为数据,而在海量的上网行为数据中如何抽取出指定用户的上网行为数据,进行上网行为数据分析,从而实现商业信息挖掘推广或网络侦查等目的,已成为众多企业重点研究解决的问题。目前,解决上网行为轨迹还原的方法主要有通过解析还原HTTP(HyperTextTransferProtocol,超文本传输协议)还原用户上网行为轨迹的方法和通过统计互联网用户使用各类上网应用的情况还原用户上网行为的方法。基于HTTP协议的上网行为轨迹还原方法,占用的网络资源和存储资源很少,且能够迅速准确的还原出用户的上网行为轨迹,但此方法只针对HTTP协议,不能实现全面的上网行为记录与分析;通过统计互联网用户使用各类上网应用的情况还原用户上网行为的方法,能够实现对各种上网行为的全面分析还原,但其侧重点在于统计用户上网应用的使用状况、上网频率及时长等,不能进行上网行为交互方面的还原分析。
技术实现思路
本专利技术要解决的技术问题是,提供一种上网行为轨迹还原的方法和装置,能够基于全面的上网行为记录还原出上网行为轨迹。本专利技术采用的技术方案是,所述上网行为轨迹还原的方法,包括:步骤1:针对具备已知互联网账号的虚拟用户,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号;步骤2:在待测时间段内,在互联网中获取符合条件的待测数据包,所述符合条件的待测数据包至少包含有所述虚拟用户的任一互联网账号;提取每个所述待测数据包中的所述虚拟用户的互联网账号和所述虚拟用户的互联网账号的特征信息;步骤3:将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户的互联网账号的特征信息集合;将所述虚拟用户的所有互联网账号的特征信息集合构成所述虚拟用户的上网行为集合;步骤4:根据所述上网行为集合,按照时间顺序显示出所述虚拟用户通过不同互联网账号上网的上网行为。进一步的,所述步骤1中,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号,包括:根据所述虚拟用户的已知互联网账号,在互联网中找到所述已知互联网账号的上线时刻、下线时刻以及IP地址,并在互联网中找到所述上线时刻到下线时刻的时间段内使用所述IP地址的其他互联网账号;或者,根据所述虚拟用户使用已知互联网账号时的登录密码,在互联网中找到使用所述登录密码的其他互联网账号。进一步的,所述步骤2中,所述特征信息包括:使用互联网账号的时间点、互联网账号的应用类型和互联网账号的上网行为。进一步的,所述步骤3,包括:步骤31:按照所述虚拟用户的互联网账号的应用类型的不同,对所述虚拟用户的每个互联网账号进行应用分类,将每个应用类型中的所述虚拟用户的互联网账号及其对应的特征信息发送到对应的合并节点上;步骤32:在每个所述合并节点上,将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户的互联网账号的特征信息集合;再将所有合并节点上的特征信息集合发送到同步节点上;步骤33:在所述同步节点上,将所有所述特征信息集合构成所述虚拟用户的上网行为集合。本专利技术还提供一种上网行为轨迹还原的装置,包括:虚拟身份挖掘模块:用于针对具备已知互联网账号的虚拟用户,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号;网络数据获取模块:用于在待测时间段内,在互联网中获取符合条件的待测数据包,所述符合条件的待测数据包至少包含有所述虚拟用户的任一互联网账号;提取每个所述待测数据包中的所述虚拟用户的互联网账号和所述虚拟用户的互联网账号的特征信息;上网行为分析模块:用于将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户的互联网账号的特征信息集合;将所述虚拟用户的所有互联网账号的特征信息集合构成所述虚拟用户的上网行为集合;上网行为显示模块:用于根据所述上网行为集合,按照时间顺序显示出所述虚拟用户通过不同互联网账号上网的上网行为。进一步的,所述虚拟身份挖掘模块,具体用于:根据所述虚拟用户的已知互联网账号,在互联网中找到所述已知互联网账号的上线时刻、下线时刻以及IP地址,并在互联网中找到所述上线时刻到下线时刻的时间段内使用所述IP地址的其他互联网账号;或者,根据所述虚拟用户使用已知互联网账号时的登录密码,在互联网中找到使用所述登录密码的其他互联网账号。进一步的,所述网络数据获取模块中,所述特征信息包括:使用互联网账号的时间点、互联网账号的应用类型和互联网账号的上网行为。进一步的,所述上网行为分析模块,包括:分类模块:用于按照所述虚拟用户的互联网账号的应用类型的不同,对所述虚拟用户的每个互联网账号进行应用分类,将每个应用类型中的所述虚拟用户的互联网账号及其对应的特征信息发送到对应的合并节点上;合并模块:用于在每个所述合并节点上,将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户的互联网账号的特征信息集合;再将所有合并节点上的特征信息集合发送到同步节点上;同步模块:用于在所述同步节点上,将所有所述特征信息集合构成所述虚拟用户的上网行为集合。采用上述技术方案,本专利技术至少具有下列优点:本专利技术所述的上网行为轨迹还原的方法和装置,能够解决在待测时间段内提取指定用户全面的上网行为记录,还原生成该用户的互联网上网行为轨迹的问题。本专利技术不是直接基于单点应用的互联网上网行为挖掘,而是运用发散的逻辑思维方式,进行多重虚拟身份关联,形成由单点到多点的广度挖掘方式。本专利技术对网络数据按网络应用类型进行数据分组,通过多节点的并行运算提高处理速度。同时本专利技术通过提取互联网账号的上网行为特征信息,能够更清晰的还原并展现用户的上网行为轨迹。附图说明图1为本专利技术第一实施例的上网行为轨迹还原方法的流程图;图2为本专利技术第三实施例的上网行为轨迹还原装置的组成结构示意图。具体实施方式为更进一步阐述本专利技术为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本专利技术进行详细说明如后。本专利技术第一实施例,一种上网行为轨迹还原的方法,如图1所示,包括以下具体步骤:步骤S101:针对具备已知互联网账号的虚拟用户,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号;具体的,在步骤S101中,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号,包括:根据所述虚拟用户的已知互联网账号,在互联网中找到所述已知互联网账号的上线时刻、下线时刻以及IP地址,并在互联网中找到所述上线时刻到下线时刻的时间段内使用所述IP地址的其他互联网账号;或者,根据所述虚拟用户使用已知互本文档来自技高网...

【技术保护点】
一种上网行为轨迹还原的方法,其特征在于,包括:步骤1:针对具备已知互联网账号的虚拟用户,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号;步骤2:在待测时间段内,在互联网中获取符合条件的待测数据包,所述符合条件的待测数据包至少包含有所述虚拟用户的任一互联网账号;提取每个所述待测数据包中的所述虚拟用户的互联网账号和所述虚拟用户的互联网账号的特征信息;步骤3:将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户的互联网账号的特征信息集合;将所述虚拟用户的所有互联网账号的特征信息集合构成所述虚拟用户的上网行为集合;步骤4:根据所述上网行为集合,按照时间顺序显示出所述虚拟用户通过不同互联网账号上网的上网行为。

【技术特征摘要】
1.一种上网行为轨迹还原的方法,其特征在于,包括:
步骤1:针对具备已知互联网账号的虚拟用户,利用联想算法,在互联网中
挖掘出所述虚拟用户的其他互联网账号;
步骤2:在待测时间段内,在互联网中获取符合条件的待测数据包,所述符
合条件的待测数据包至少包含有所述虚拟用户的任一互联网账号;提取每个所
述待测数据包中的所述虚拟用户的互联网账号和所述虚拟用户的互联网账号的
特征信息;
步骤3:将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户
的互联网账号的特征信息集合;将所述虚拟用户的所有互联网账号的特征信息
集合构成所述虚拟用户的上网行为集合;
步骤4:根据所述上网行为集合,按照时间顺序显示出所述虚拟用户通过不
同互联网账号上网的上网行为。
2.根据权利要求1所述的上网行为轨迹还原的方法,其特征在于,所述步
骤1中,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号,
包括:
根据所述虚拟用户的已知互联网账号,在互联网中找到所述已知互联网账
号的上线时刻、下线时刻以及IP地址,并在互联网中找到所述上线时刻到下线
时刻的时间段内使用所述IP地址的其他互联网账号;或者,
根据所述虚拟用户使用已知互联网账号时的登录密码,在互联网中找到使
用所述登录密码的其他互联网账号。
3.根据权利要求1所述的上网行为轨迹还原的方法,其特征在于,所述步
骤2中,所述特征信息包括:使用互联网账号的时间点、互联网账号的应用类
型和互联网账号的上网行为。
4.根据权利要求3所述的上网行为轨迹还原的方法,其特征在于,所述步

\t骤3,包括:
步骤31:按照所述虚拟用户的互联网账号的应用类型的不同,对所述虚拟
用户的每个互联网账号进行应用分类,将每个应用类型中的所述虚拟用户的互
联网账号及其对应的特征信息发送到对应的合并节点上;
步骤32:在每个所述合并节点上,将所述虚拟用户的同一个互联网账号的
特征信息构成所述虚拟用户的互联网账号的特征信息集合;再将所有合并节点
上的特征信息集合发送到同步节点上;
步骤33:在所述同步节点上,将所有所述特征信息集合构成所述虚拟用户
的上网行为集合。
5.一种上网行为...

【专利技术属性】
技术研发人员:陈雪松安洋代启亮李海静张养辉
申请(专利权)人:中国电子科技集团公司第十五研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1