用于处理日志信息的方法和装置制造方法及图纸

技术编号:19219448 阅读:36 留言:0更新日期:2018-10-20 08:06
本申请实施例公开了用于处理日志信息的方法和装置。该方法的一具体实施方式包括:获取至少一个历史时间段内的请求日志;对于至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址,得到第二目标IP地址集合;基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率;确定第一概率是否大于目标概率阈值;响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。该实施方式实现了对请求日志的处理。

【技术实现步骤摘要】
用于处理日志信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于处理日志信息的方法和装置。
技术介绍
一般地,对于网络设备或智能设备来说,通常利用大数据技术或者基于网络设备或智能设备上的Cookies(在本地终端上存储的能够用于辨别用户身份的数据)对各个设备的编号进行关联映射,从而得到某个网络设备或智能设备相关的其它设备。
技术实现思路
本申请实施例提出了用于处理日志信息的方法和装置。第一方面,本申请实施例提供了一种用于处理日志信息的方法,该方法包括:获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址;对于至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合;基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,其中,第一概率用于表示第一主机标识出现的情况下,第二主机标识出现的概率;确定第一概率是否大于目标概率阈值;响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。在一些实施例中,基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,包括:确定至少一个历史时间段中的各个历史时间段对应的第一目标IP地址集合中的地址数目的总和,记为第一总和;确定至少一个历史时间段中的各个历史时间段对应的第二目标IP地址集合中的地址数目的总和,记为第二总和;将第一总和除以第二总和得到的商确定为第一概率。在一些实施例中,该方法还包括:基于第一总和,确定第一调节值和第二调节值;确定第一总和与第一调节值的乘积的双曲正切函数值;将第二调节值与双曲正切函数值的乘积确定为目标概率阈值。在一些实施例中,至少一个历史时间段内的各个时间段的时间长度相同。在一些实施例中,该方法还包括:解析包含目标主机标识的记录;基于解析结果,向第一主机标识对应的主机推送目标信息。第二方面,本申请实施例提供了一种用于处理日志信息的装置,该装置包括:获取单元,被配置成获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址;地址确定单元,被配置成对于至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合;第一概率确定单元,被配置成基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,其中,第一概率用于表示第一主机标识出现的情况下,第二主机标识出现的概率;比较单元,被配置成确定第一概率是否大于目标概率阈值;目标主机标识确定单元,被配置成响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。在一些实施例中,第一概率确定单元进一步被配置成:确定至少一个历史时间段中的各个历史时间段对应的第一目标IP地址集合中的地址数目的总和,记为第一总和;确定至少一个历史时间段中的各个历史时间段对应的第二目标IP地址集合中的地址数目的总和,记为第二总和;将第一总和除以第二总和得到的商确定为第一概率。在一些实施例中,该装置还包括:调节值确定单元,被配置成基于第一总和,确定第一调节值和第二调节值;双曲正切函数值确定单元,被配置成确定第一总和与第一调节值的乘积的双曲正切函数值;目标概率阈值确定单元,被配置成将第二调节值与双曲正切函数值的乘积确定为目标概率阈值。在一些实施例中,至少一个历史时间段内的各个时间段的时间长度相同。在一些实施例中,该装置还包括:解析单元,被配置成解析包含目标主机标识的记录;目标信息推送单元,被配置成基于解析结果,向第一主机标识对应的主机推送目标信息。第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的用于处理日志信息的方法和装置,通过先获取至少一个历史时间段内的请求日志,然后基于每个历史时间段内的请求日志中的各条记录中包含的主机标识和IP地址,确定第一主机标识出现的情况下,第二主机标识出现的概率,记为第一概率。然后,比较第一概率与目标概率阈值的大小关系,若第一概率较大,那么就将第二主机标识确定为目标主机标识,从而实现了基于请求日志中的各条记录的内容,确定第一主机标识出现的情况下,第二主机标识出现的概率,并根据确定的概率,对第二主机标识进行筛选,以得到目标主机标识。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是本申请的用于处理日志信息的方法的一个实施例的流程图;图3a是本申请的用于处理日志信息的方法的包含第一主机标识的记录的一个实施例的示意图;图3b是本申请的用于处理日志信息的方法的包含第二主机标识的记录的一个实施例的示意图;图4是根据本申请的用于处理日志信息的方法的一个应用场景的示意图;图5是根据本申请的用于处理日志信息的方法的又一个实施例的流程图;图6是根据本申请的用于处理日志信息的装置的一个实施例的结构示意图;图7是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于处理日志信息的方法或用于处理日志信息的装置的示例性架构100。如图1所示,系统架构100可以包括终端设备101、数据库102、网络103和服务器104。网络103用以在终端设备101、数据库102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、数据库102通过网络103与服务器104交互,以进行数据交互等。终端设备101上可以安装有各种客户端应用,如日志管理软件等。数据库102中可以存储有日志信息。终端设备101可以是硬件,也可以是软件。当终端设备101为硬件时,可以是支持日志信息处理的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101为软件时,可以安装在上本文档来自技高网...

【技术保护点】
1.一种用于处理日志信息的方法,包括:获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址;对于所述至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含所述第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合;基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,其中,所述第一概率用于表示所述第一主机标识出现的情况下,所述第二主机标识出现的概率;确定所述第一概率是否大于目标概率阈值;响应于所述第一概率大于目标概率阈值,将所述第二主机标识确定为目标主机标识。

【技术特征摘要】
1.一种用于处理日志信息的方法,包括:获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址;对于所述至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含所述第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合;基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,其中,所述第一概率用于表示所述第一主机标识出现的情况下,所述第二主机标识出现的概率;确定所述第一概率是否大于目标概率阈值;响应于所述第一概率大于目标概率阈值,将所述第二主机标识确定为目标主机标识。2.根据权利要求1所述的方法,其中,所述基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,包括:确定所述至少一个历史时间段中的各个历史时间段对应的第一目标IP地址集合中的地址数目的总和,记为第一总和;确定所述至少一个历史时间段中的各个历史时间段对应的第二目标IP地址集合中的地址数目的总和,记为第二总和;将所述第一总和除以所述第二总和得到的商确定为所述第一概率。3.根据权利要求2所述的方法,其中,所述方法还包括:基于所述第一总和,确定第一调节值和第二调节值;确定所述第一总和与所述第一调节值的乘积的双曲正切函数值;将所述第二调节值与所述双曲正切函数值的乘积确定为所述目标概率阈值。4.根据权利要求1所述的方法,其中,所述至少一个历史时间段内的各个时间段的时间长度相同。5.根据权利要求1-4之一所述的方法,其中,所述方法还包括:解析包含所述目标主机标识的记录;基于解析结果,向所述第一主机标识对应的主机推送目标信息。6.一种用于处理日志信息的装置,其中,包括:获取单元,被配置成获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址;地址确定单元,被配置成对于所述至少一个历史时间...

【专利技术属性】
技术研发人员:马蕴杨温天伟罗金梅张瑞
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1