【技术实现步骤摘要】
一种IP黑名单确定方法、装置、设备及存储介质
本申请实施例涉及网络异常流量识别
,例如涉及一种IP黑名单确定方法、装置、设备及存储介质。
技术介绍
随着智能手机、平板电脑等移动终端设备的普及,第三方应用程序客户端逐渐成为广告主投放广告的主要载体,第三方应用程序(Application,APP)厂商将APP中广告位托管给广告网络(AdvertisementNetwork,ADN),借助AND的销售和代理团队进行变现。但是部分群体通过伪造广告的浏览和点击流量攫取巨额利益,严重损害了广告主的利益,这种伪造的浏览称之为“异常流量”。为了维护广告主的合法权益,需要对产生异常流量的IP进行识别,快速确定IP黑名单,是监测并控制异常流量的重要手段。但是相关技术中在生成可疑IP黑名单时,使用的方法大多是在某一个预置的时间段内,根据用户的信息,统计访问次数超过预设阈值的IP确定为可疑IP。但是在相邻两个预置的时间段内,实际访问情况可能会有较大的差异,即IP流量可能存在波动,上一个预置时间段内确定的可疑IP名单与下一个预置时间段内确定的可疑IP名单也会有较大的出入,从而无法准确确定可疑IP名单。为解决上述技术问题,本申请提出一种IP黑名单确定方法、装置、设备及存储介质。
技术实现思路
本申请实施例提供一种IP黑名单确定方法方法,基于波动系数确定IP黑名单,可以在不搜集用户信息的情况下,从IP波动情况的角度对异常IP进行综合分析,提升IP黑名单确定的准确性。第一方面,本申请实施例提供了一种IP黑名 ...
【技术保护点】
1.一种IP黑名单确定方法,其特征在于,所述方法包括:/n确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;/n根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;/n根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。/n
【技术特征摘要】
1.一种IP黑名单确定方法,其特征在于,所述方法包括:
确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;
根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;
根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
2.根据权利要求1所述的方法,其特征在于,所述根据每个IP在预设周期内的曝光量确定第一IP黑名单,包括:
将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的曝光量eachHourimp;
根据每个IP在所述预设周期内所述逐小时的曝光量eachHourimp,计算每个IP的第一波动概率;
对所述多个IP的所述逐小时的曝光量eachHourimp进行聚类,确定符合第一预设条件的第一IP集合;
从所述第一IP集合中选取所述第一波动概率大于第一预设阈值的IP,并将选取出的IP作为第一IP黑名单。
3.根据权利要求1所述的方法,其特征在于,所述根据每个IP在预设周期内的点击量确定第二IP黑名单,包括:
将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的点击量eachHourclick;
根据每个IP在所述预设周期内所述逐小时的点击量eachHourclick,计算每个IP的第二波动概率;
对所述多个IP的所述逐小时的点击量eachHourclick进行聚类,确定符合第二预设条件的第二IP集合;
从所述第二IP集合中选取所述第二波动概率大于第二预设阈值的IP,并将选取出的IP作为第二IP黑名单。
4.根据权利要求2所述的方法,其特征在于,根据每个IP在所述预设周期内所述逐小时的曝光量eachHourimp,计算每个IP的第一波动概率,包括:
根据计算每个IP的第一波动系数;
根据计算每个IP的所述第一波动概率;
其中,cv1表示每个IP的所述第一波动系数,Mean函数是取均值的函数,Std函数取标准差的函数,p1表示每个IP的所述第一波动概率,μ1表示所述多个IP的所述第一波动系数的均值,σ1表示所述多个IP的所述第一波动系数的标准差。
5.根据权利要求3所述的方法,其特征在于,根据每个IP在所述预设周期内所述逐小时的点击量eachHourclick,计算每个IP的第二波动概率,包括:
根据计算每个IP的第二波动系数;
根据计算每个IP的所述第二波动概率;
其中,cv2表示每个IP的所述第二波动系数,Mean...
【专利技术属性】
技术研发人员:刘洋,田丹丹,卫海天,
申请(专利权)人:北京明略昭辉科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。