一种机票搜索流量异常的检测方法技术

技术编号:25988965 阅读:30 留言:0更新日期:2020-10-20 18:56
本发明专利技术公开一种机票搜索流量异常的检测方法。所述方法包括:从流量日志的搜索请求中获取渠道参数,选取第一时段,将第一时段划分成N个区间,统计每个渠道在每个区间内的请求次数,得到第一时段每个渠道的请求数据,按照相同方法得到第二时段每个渠道的请求数据,分别针对第一时段和第二时段计算任意两个渠道请求数据的相关系数R(X

【技术实现步骤摘要】
一种机票搜索流量异常的检测方法
本专利技术属于机票查询
,具体涉及一种机票搜索流量异常的检测方法。
技术介绍
目前,在多数机票购买平台上,机票搜索的流量一般来自多个渠道,如手机客户端,网页端,微信端等。由于系统出错或遭到黑客攻击,经常出现一个或多个渠道的流量在某一时段急剧增大或减小的现象。系统出错的原因很多,如代码bug、网络、服务器资源异常等等。当发生错误时,产生的结果可能是搜索请求得不到及时返回,不断地重复发起请求,导致流量产生较大增加;也可能是搜索请求达不到后端,导致流量减少。遭受攻击的情况最可能的就是有第三方利用爬虫技术来获取航线航班数据,不断地发起各种搜索请求,导致流量增大。流量的异常增大并不会带来额外的订单量,相反可能影响正常用户的购票;特别是被爬虫爬取数据,几乎无法带来订单转化订单减少收益就会减少,流量增大却没有带来更多的订单就会造成资源浪费。对于流量产生较大变化的情况,工作人员需要确认其原因,判断是否为系统错误或是遭受攻击等,以避免资源的浪费。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术提出一种机票搜索流量异常的检测方法。为实现上述目的,本专利技术采用如下技术方案:一种机票搜索流量异常的检测方法,包括以下步骤:步骤1,从流量日志的搜索请求中获取请求时间及请求来源即渠道;步骤2,选取第一时段,将第一时段划分成N个区间,统计每个渠道在每个区间内的请求次数,得到每个渠道的请求数据Xi={xi-1,xi-2,…,xi-N},i=1,2,…,M,M为渠道总数;步骤3,选取起止时刻与第一时段均相同的第二时段,将第二时段划分成与第一时段相同的N个区间,统计每个渠道在每个区间内的请求次数,得到每个渠道的请求数据Yi={yi-1,yi-2,…,yi-N};步骤4,分别针对第一时段和第二时段计算任意两个渠道请求数据的相关系数R(Xi,Xj)和R(Yi,Yj),并计算差值ΔR(i,j)=|R(Xi,Xj)-R(Yi,Yj)|,1≤i<j≤M;步骤5,分别统计大于设定阈值的ΔR(i,j)中各个渠道i、j出现的次数,出现次数最多的K个渠道为异常渠道,K≧1。与现有技术相比,本专利技术具有以下有益效果:本专利技术通过从流量日志中的搜索请求中获取渠道参数,选取第一时段,将第一时段划分成N个区间,统计每个渠道在每个区间内的请求次数,得到第一时段每个渠道的请求数据,按照相同方法得到第二时段每个渠道的请求数据,分别针对第一时段和第二时段计算任意两个渠道请求数据的相关系数R(Xi,Xj)和R(Yi,Yj),并计算二者差的绝对值ΔR(i,j),分别统计大于设定阈值的ΔR(i,j)中各个渠道i、j出现的次数,出现次数最多的K个渠道为异常渠道,实现了异常渠道的自动检测。本专利技术能够基于流量日志中的搜索请求数据自动检测发生异常的渠道,有助于业务人员及时发现并采取措施,避免资源的浪费。附图说明图1为本专利技术实施例一种机票搜索流量异常的检测方法的流程图。具体实施方式下面结合附图对本专利技术作进一步详细说明。本专利技术实施例一种机票搜索流量异常的检测方法,流程图如图1所示,所述方法包括以下步骤:S101、从流量日志的搜索请求中获取请求时间及请求来源即渠道;S102、选取第一时段,将第一时段划分成N个区间,统计每个渠道在每个区间内的请求次数,得到每个渠道的请求数据Xi={xi-1,xi-2,…,xi-N},i=1,2,…,M,M为渠道总数;S103、选取起止时刻与第一时段均相同的第二时段,将第二时段划分成与第一时段相同的N个区间,统计每个渠道在每个区间内的请求次数,得到每个渠道的请求数据Yi={yi-1,yi-2,…,yi-N};S104、分别针对第一时段和第二时段计算任意两个渠道请求数据的相关系数R(Xi,Xj)和R(Yi,Yj),并计算差值ΔR(i,j)=|R(Xi,Xj)-R(Yi,Yj)|,1≤i<j≤M;S105、分别统计大于设定阈值的ΔR(i,j)中各个渠道i、j出现的次数,出现次数最多的K个渠道为异常渠道,K≧1。在本实施例中,步骤S101主要用于获取搜索请求的时间和渠道。流量日志中记录了搜索请求信号的时间及请求来源,也就是渠道,比如微信端、手机客户端等。除搜索请求参数之外,流量日志还有其它许多业务人员记录的各类参数,这些参数主要是用来排查问题,或是用作统计。本实施例只关心请求来源即渠道和请求次数。日志的条数即可代表请求次数,请求来源包含在请求参数里。渠道参数是用约定的字符串表示,用来表示搜索请求来自哪里,如“hbgj”表示航班管家APP。下面给出一个具体的流量日志:2020-06-2909:58:56-analyseSourceEntry=gwc_r_3_2_6_3_4&channelcode=hbgj&date=2020-07-01&dst=NKG&from=hbgj&org=CQS_C&p=BCHWzhihuiyun,android.9,hbgj,7.8.2,VKY-AL00&st=6&traceid=01ab5a63f3827001&transfer_msg=28,200&tripType=TB&uid=218898645043328&userid=109443828&xxxid=bKy27894其中的“from=hbgj”表示这个请求的渠道参数为“hbgj”,即搜索请求来自航班管家APP。在本实施例中,步骤S102主要用于统计选取的第一时段内各渠道的请求数据。首先,选取第一时段。选取的时段一般是一天中的一个时间段,比如从上午09:00到夜间23:00,也可以是一整天,如从00:00到24:00。当然也可以是跨天的,如晚上20:00到第二天早晨08:00。然后,将所选时段划分成N个区间。这N个区间的长度可以是相等的,也可以是不等的,比如间隔长度构成等差数列。最后,统计每个渠道在每个区间内的请求次数,得到每个渠道的请求数据,比如,第i个渠道请求数据为Xi={xi-1,xi-2,…,xi-N},xi-n为第i个渠道在第n个区间的请求次数。在本实施例中,步骤S103主要用于统计选取的第二时段内各渠道的请求数据。由于渠道的请求次数与时间是紧密相关的,比如工作日每天同一时段内同一渠道的请求次数近似相等,因此第二时段的起止时间应该与第一时段相同,区间划分也相同,相当于第一时段在不同日期的一个COPY。第二时段与第一时段可以是相邻的两个日期,也可以是不相邻的两个日期,比如相邻的两个周一。选取时应遵循的原则是:一是这两个时段的特点一定要尽量接近,比如,不能一个是节假日,一个是工作日;二是相隔的日期要尽量近,比如最好能够是相邻两个日期。为了提高检测精度,还可以采用多个时段同一渠道请求数据的平均值作为一个时段的请求数据。第二时段第i个渠道请求数据记本文档来自技高网...

【技术保护点】
1.一种机票搜索流量异常的检测方法,其特征在于,包括以下步骤:/n步骤1,从流量日志的搜索请求中获取请求时间及请求来源即渠道;/n步骤2,选取第一时段,将第一时段划分成N个区间,统计每个渠道在每个区间内的请求次数,得到每个渠道的请求数据X

【技术特征摘要】
1.一种机票搜索流量异常的检测方法,其特征在于,包括以下步骤:
步骤1,从流量日志的搜索请求中获取请求时间及请求来源即渠道;
步骤2,选取第一时段,将第一时段划分成N个区间,统计每个渠道在每个区间内的请求次数,得到每个渠道的请求数据Xi={xi-1,xi-2,…,xi-N},i=1,2,…,M,M为渠道总数;
步骤3,选取起止时刻与第一时段均相同的第二时段,将第二时段划分成与第一时段相同的N个区间,统计每个渠道在每个区间内的请求次数,得到每个渠道的请求数据Yi={yi-1,yi-2,…,yi-N};
步骤4,分别针对第一时段和第二时段计算任意两个渠道请求数据的相关系数R(Xi,Xj)和R(Yi,Yj)...

【专利技术属性】
技术研发人员:刘小雷李尚锦
申请(专利权)人:深圳市活力天汇科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1