一种落地页监控方法及系统技术方案

技术编号:21116218 阅读:26 留言:0更新日期:2019-05-16 09:07
本发明专利技术实施例提供一种落地页监控方法及系统,所提供的方法包括:当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。本发明专利技术实施例提供的方法,采用通用性较强的js技术提取广告投放者投放的广告页的最终落地页的特征信息,与备案的合法落地页的特性信息进行比对,能适应性对多种加载html广告页的载体进行实时监控,且实时的对每次用户的请求做监控,能实现对广告落地页篡改的实时发现、实时报警、实时处理。

A Landing Page Monitoring Method and System

【技术实现步骤摘要】
一种落地页监控方法及系统
本专利技术实施例涉及网络安全
,尤其涉及一种落地页监控方法及系统。
技术介绍
在互联网广告投放领域,由于投放的广告位的最终跳转落地页容易被广告投放者进行修改,因此流量提供方往往无法对这些跳转页的最终落地页进行有效的控制,导致一些不法分子通过随意修改所发布的信息的落地页,对流量提供方的业务安全造成影响。现有技术中,常用的对跳转页的控制方法往往是对广告投放的环境中对落地页禁止其二次跳转,然而,现有技术中限制了投放链接的二次跳转,对于部分投放商家来说等于限制了其投放方式,必定会导致部分客户的使用场景受限,另一方面,限制二次跳转只能解决部分使用跳转方式来更换页面内容的篡改者,而很多使用动态Ajax请求来控制页面内容变更的篡改方式,是无法限制的。
技术实现思路
本专利技术实施例提供一种落地页监控方法及系统,用以解决现有技术中限制了投放链接的二次跳转,对于部分投放商家来说等于限制了其投放方式,必定会导致部分客户的使用场景受限,同时无法对所有的落地页篡改动作进行有效的限制的问题。第一方面,本专利技术实施例提供一种落地页监控方法,包括:当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。第二方面,本专利技术实施提供一种落地页监控系统,包括:结构信息提取模块,用于当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;页面特征提取模块,用于将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;匹配模块,用于将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一方面所提供的落地页监控方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面所提供的落地页监控方法的步骤。本专利技术实施例提供的方法提取广告投放者投放广告页的最终落地页的特征信息,与备案的合法落地页的特性信息进行比对,能适应性对多种加载html广告页的载体进行实时监控,且实时的对每次用户的请求做监控,能实现对广告落地页篡改的实时发现、实时报警、实时处理。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的落地页监控方法的流程示意图;图2为本专利技术一实施例提供的落地页监控系统的结构示意图;图3为本专利技术一实施例提供的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参考图1,图1为本专利技术一实施例提供的落地页监控方法的流程示意图,所提供的方法包括:S1,当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;S2,将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;S3,将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。具体的,当平台商加载html广告时,对加载环境强制加载一个监测页面内容的js,通过该js可以对页面的结构进行内容提取,获得落地页的结构信息,随后,进一步的对页面的结构信息做序列转化,序列转化的输出为该落地页结构信息的字符串表示,将该字符串表示作为落地页的页面特征信息,将该页面特征信息与广告投放者备案时的合法落地页特征刻画库中的特征信息进行匹配,若匹配结果为没有相同的匹配信息,则可以表示该广告投放者的落地页被篡改,此时系统发出警报,以便平台商对该广告进行下线处理或以其它方式对广告进行处理。通过此方法,采用通用性较强的js技术提取广告投放者投放的广告页的最终落地页的特征信息,与备案的合法落地页的特性信息进行比对,能适应性对多种加载html广告页的载体进行实时监控,且实时的对每次用户的请求做监控,能实现对广告落地页篡改的实时发现、实时报警、实时处理。在上述实施例的基础上,所述落地页加载之前,还包括:对所有合法的落地页的结构进行特征提取并获取所有落地页的页面特征,构建落地页特征刻画库。其中,所述方法还包括对每一个落地页进行合法性审核,保留合法落地页并清除非法落地页。具体的,平台方在对投放的广告做审核时,该系统会对确认合法的内容做落地页的读取和确认,并由审核人员确认读取的正确性,落地页可能有多个或者多层跳转,均由审核人员做合法性确认,在获得了具有合法性的落地页后,系统对合法的落地页结构进行内容提取,获得合法落地页的结构信息,进一步的,将每个合法落地页的结构信息进行序列转化,获得合法落地页的字符串表示作为特征信息,将这些特征信息构建落地页特征刻画库。在上述实施例的基础上,所述对所述落地页的结构进行内容提取,获取所述落地页的结构信息的步骤具体包括:提取所述落地页中url域名、url结构、页面字节长度、页面html标签数、图片资源数、图片hash、文字数量、文本hash中任意一项或多项的组合,获得所述落地页的结构信息。具体的,对落地页的结构信息提取的步骤具体包括,对落地页中好办的页面的内容信息例如url域名、url结构、页面字节长度、页面html标签数、图片资源数、图片hash、文字数量、文本hash等内容信息中的一项或多项的组合,构建落地页的结构信息,其中,结构信息包含各类型标签的结构和顺序、图片的hash以及出现顺序等内容。通过此方法,使用一种简单的特征提取方法,兼顾了html页面的内容信息比对与结构信息比对,能实现准确快速的辨别2个页面直接的相似性。在上述实施例的基础上,所述将所述页面特征与预设的落地页特征刻画库中的特征进行比对之后的步骤,还包括:若所述页面特征与预设的落地页也特征刻画库中的特征匹配成功,则判定所述落地页为合法页面。具体的,当落地页的内容匹配成功后,则判定加载的落地页为合法落地页,系统继续执行加载操作。通过此方法,不会限制广告投放者的投放形式,而是以主动监测形式对广告页进行监控,只有当广告商出现异常时,系统才会对投放者处理。参考图2,图2为本专利技术一实施例提供的落地页监控系统的结构示意图,所提供的系统包括:结构信息提取模块21,页面特征提取模块22和匹配模块23。其中,结构信息提取模块21用于当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;页面特征提取本文档来自技高网...

【技术保护点】
1.一种落地页监控方法,其特征在于,包括:当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。

【技术特征摘要】
1.一种落地页监控方法,其特征在于,包括:当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。2.根据权利要求1所述的方法,其特征在于,所述落地页加载之前,还包括:对所有合法的落地页的结构进行特征提取并获取所有落地页的页面特征,构建落地页特征刻画库。3.根据权利要求2所述的方法,其特征在于,所述方法还包括,对每一个落地页进行合法性审核,保留合法落地页并清除非法落地页。4.根据权利要求1所述的方法,其特征在于,所述对所述落地页的结构进行内容提取,获取所述落地页的结构信息的步骤具体包括:提取所述落地页中url域名、url结构、页面字节长度、页面html标签数、图片资源数、图片hash、文字数量、文本hash中任意一项或多项的组合,获得所述落地页的结构信息。5.根据权利要求1所述的方法,其特征在于,所述将所述页面特征与预设的落地页特征刻画库中的特征...

【专利技术属性】
技术研发人员:王文达陈国庆
申请(专利权)人:武汉极意网络科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1