【技术实现步骤摘要】
本专利技术涉及互联网
,尤其涉及一种上网行为轨迹还原的方法和装置。
技术介绍
随着计算机的普及和互联网络的快速发展,互联网提供了种类繁多的应用,包括电子商务、社区论坛、网络交友、即时聊天和邮箱服务等,用户通过各种邮箱服务收发邮件、通过各类社交软件发布信息等都会形成上网行为数据。基于互联网用户的庞大基数及网络为用户提供的丰富应用服务,在短时间内会迅速地积累海量的上网行为数据,而在海量的上网行为数据中如何抽取出指定用户的上网行为数据,进行上网行为数据分析,从而实现商业信息挖掘推广或网络侦查等目的,已成为众多企业重点研究解决的问题。目前,解决上网行为轨迹还原的方法主要有通过解析还原HTTP(HyperTextTransferProtocol,超文本传输协议)还原用户上网行为轨迹的方法和通过统计互联网用户使用各类上网应用的情况还原用户上网行为的方法。基于HTTP协议的上网行为轨迹还原方法,占用的网络资源和存储资源很少,且能够迅速准确的还原出用户的上网行为轨迹,但此方法只针对HTTP协议,不能实现全面的上网行为记录与分析;通过统计互联网用户使用各类上网应用的情况还原用户上网行为的方法,能够实现对各种上网行为的全面分析还原,但其侧重点在于统计用户上网应用的使用状况、上网频率及时长等,不能进行上网行为交互方面的还原分析。
技术实现思路
本专利技术要解决的技术问题是,提供一种上网行为轨迹还原的方法和装置,能够基于全面的上网行为记录还原出上网行为轨迹。本专利技术采用的技术方案是,所述上网行为轨迹还原的方法,包括:步 ...
【技术保护点】
一种上网行为轨迹还原的方法,其特征在于,包括:步骤1:针对具备已知互联网账号的虚拟用户,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号;步骤2:在待测时间段内,在互联网中获取符合条件的待测数据包,所述符合条件的待测数据包至少包含有所述虚拟用户的任一互联网账号;提取每个所述待测数据包中的所述虚拟用户的互联网账号和所述虚拟用户的互联网账号的特征信息;步骤3:将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户的互联网账号的特征信息集合;将所述虚拟用户的所有互联网账号的特征信息集合构成所述虚拟用户的上网行为集合;步骤4:根据所述上网行为集合,按照时间顺序显示出所述虚拟用户通过不同互联网账号上网的上网行为。
【技术特征摘要】
1.一种上网行为轨迹还原的方法,其特征在于,包括:
步骤1:针对具备已知互联网账号的虚拟用户,利用联想算法,在互联网中
挖掘出所述虚拟用户的其他互联网账号;
步骤2:在待测时间段内,在互联网中获取符合条件的待测数据包,所述符
合条件的待测数据包至少包含有所述虚拟用户的任一互联网账号;提取每个所
述待测数据包中的所述虚拟用户的互联网账号和所述虚拟用户的互联网账号的
特征信息;
步骤3:将所述虚拟用户的同一个互联网账号的特征信息构成所述虚拟用户
的互联网账号的特征信息集合;将所述虚拟用户的所有互联网账号的特征信息
集合构成所述虚拟用户的上网行为集合;
步骤4:根据所述上网行为集合,按照时间顺序显示出所述虚拟用户通过不
同互联网账号上网的上网行为。
2.根据权利要求1所述的上网行为轨迹还原的方法,其特征在于,所述步
骤1中,利用联想算法,在互联网中挖掘出所述虚拟用户的其他互联网账号,
包括:
根据所述虚拟用户的已知互联网账号,在互联网中找到所述已知互联网账
号的上线时刻、下线时刻以及IP地址,并在互联网中找到所述上线时刻到下线
时刻的时间段内使用所述IP地址的其他互联网账号;或者,
根据所述虚拟用户使用已知互联网账号时的登录密码,在互联网中找到使
用所述登录密码的其他互联网账号。
3.根据权利要求1所述的上网行为轨迹还原的方法,其特征在于,所述步
骤2中,所述特征信息包括:使用互联网账号的时间点、互联网账号的应用类
型和互联网账号的上网行为。
4.根据权利要求3所述的上网行为轨迹还原的方法,其特征在于,所述步
\t骤3,包括:
步骤31:按照所述虚拟用户的互联网账号的应用类型的不同,对所述虚拟
用户的每个互联网账号进行应用分类,将每个应用类型中的所述虚拟用户的互
联网账号及其对应的特征信息发送到对应的合并节点上;
步骤32:在每个所述合并节点上,将所述虚拟用户的同一个互联网账号的
特征信息构成所述虚拟用户的互联网账号的特征信息集合;再将所有合并节点
上的特征信息集合发送到同步节点上;
步骤33:在所述同步节点上,将所有所述特征信息集合构成所述虚拟用户
的上网行为集合。
5.一种上网行为...
【专利技术属性】
技术研发人员:陈雪松,安洋,代启亮,李海静,张养辉,
申请(专利权)人:中国电子科技集团公司第十五研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。