一种互联网广告落地页防篡改方法和系统技术方案

技术编号:32806228 阅读:18 留言:0更新日期:2022-03-26 19:58
本发明专利技术公开了一种互联网广告落地页防篡改方法和系统,所述方法包括:建立巡查脚本,将所述巡查脚本插入浏览器定期巡查广告落地页;对当前广告落地页进行截图,并将该截图上传到云端;预设间隔时间,根据所述间隔时间重新巡查所述广告落地页并截图上传到云端;在云端采用图片差异算法计算先后上传的截图差异度,设置差异度阈值,若先后两张截图差异度大于所述差异度阈值,则执行广告落地页的下线操作,通过puppeteer打开广告落地页执行巡查操作。所述方法和系统通过在不同时段对同一个落地页进行截图,并将截图上传到云端,在云端对截图进行识别,并判断是否存在内容差异,从而可以判断是否存在恶意篡改等行为。判断是否存在恶意篡改等行为。判断是否存在恶意篡改等行为。

【技术实现步骤摘要】
一种互联网广告落地页防篡改方法和系统


[0001]本专利技术涉及互联网广告
,特别涉及一种互联网广告落地页防篡改方法和系统。

技术介绍

[0002]目前在移动互联时代,广告主在广告平台进行广告投放,用户点击广告位进入广告主落地页。广告主为了通过审核先是提交一版正常的页面,等待审核通过后再对页面内容进行修改。现有方案是通过人工定时巡查页面,防止出现类似篡改等情况。然而现有的人工定时巡查页面存在如下技术问题:1、广告主会对落地页进行恶意的篡改,导致用户体验较差,并且可能导致流量浪费的问题。2、人工审核的广告主的广告页效率低下,且容易出现审核漏洞的问题。3、人工审核无法记录广告主的违规行为,无法在检测过程中留下违规记录。

技术实现思路

[0003]本专利技术其中一个专利技术目的在于提供一种互联网广告落地页防篡改方法和系统,所述方法和系统通过计算机程序实现对广告落地页的自动巡查,可实现自动化高效地巡查,降低人工巡查的成本。
[0004]本专利技术另一个专利技术目的在于提供一种互联网广告落地页防篡改方法和系统,所述方法和系统通过在不同时段对同一个落地页进行截图,并将截图上传到云端,在云端对截图进行识别,并判断是否存在内容差异,从而可以判断是否存在恶意篡改等行为。
[0005]本专利技术另一个专利技术目的在于提供一种互联网广告落地页防篡改方法和系统,所述方法和系统通过ocr识别技术识别截图中相关的敏感词和违规词等,命中后进一步执行落地页的下线操作,因此可以实现自动巡查,提高巡查的效率。/>[0006]为了实现至少一个上述专利技术目的,本专利技术进一步提供一种互联网广告落地页防篡改方法,所述方法包括如下步骤:
[0007]建立巡查脚本,将所述巡查脚本插入浏览器定期巡查广告落地页;
[0008]对当前广告落地页进行截图,并将该截图上传到云端;
[0009]预设间隔时间,根据所述间隔时间重新巡查所述广告落地页并截图上传到云端;
[0010]在云端采用图片差异算法计算先后上传的截图差异度,设置差异度阈值,若先后两张截图差异度大于所述差异度阈值,则执行广告落地页的下线操作或进行人工审核。
[0011]根据本专利技术其中一个较佳实施例,所述巡查脚本插入到无头浏览器,并通过puppeteer打开广告落地页执行巡查操作。
[0012]根据本专利技术另一个较佳实施例,所述先后上传云端的截图包括第一截图和第二截图,其中第一截图先于第二截图上传,所述云端包括ocr文字识别模块,所述第一截图和第二截图在在云端分别识别截图中的文字数据;预设敏感词库,将识别的文字数据和敏感词库对比,若存在敏感词,则执行所述落地页的下线操作。
[0013]根据本专利技术另一个较佳实施例,所述巡查脚本执行巡查操作包括:打开无头浏览三个窗口,且所述三个窗口的页面数量均等分,在完成三个窗口页面的加载后完成后执行页面的截图操作。
[0014]根据本专利技术另一个较佳实施例,当所述巡查脚本巡查到广告端的落地页时,在所述落地页生成落地页链接,并将所述落地页链接发送给所述puppeteer。
[0015]根据本专利技术另一个较佳实施例,所述图片的差异算法包括:云端获取第一截图和第二截图,对比所述第一截图和第二截图的尺寸,若第一截图和第二截图的尺寸不同,则退出并返回错误信息。
[0016]根据本专利技术另一个较佳实施例,若所述第一截图和第二截图的尺寸相同,则分别对两个截图建立画布,分别对两个截图进行渲染,并遍历渲染后两个截图的像素信息,若相同,则返回无差异信息。
[0017]根据本专利技术另一个较佳实施例,若对所述第一截图和第二截图渲染的图像像素存在差异,在遍历两个图像的像素后计算差异度,将大于所述差异度阈值的第一截图和第二截图传入到人工审核系统中。
[0018]为了实现至少一个上述专利技术目的,本专利技术进一步提供一种互联网广告落地页防篡改系统,所述系统执行上述一种互联网广告落地页防篡改方法。
[0019]本专利技术进一步提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序可被处理器执行上述一种互联网广告落地页防篡改方法。
附图说明
[0020]图1显示的是本专利技术一种互联网广告落地页防篡改方法的流程示意图。
[0021]图2显示的是本专利技术一种互联网广告落地页防篡改方法的时序示意图。
具体实施方式
[0022]以下描述用于揭露本专利技术以使本领域技术人员能够实现本专利技术。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本专利技术的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本专利技术的精神和范围的其他技术方案。
[0023]可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。
[0024]请结合图1

图2,本专利技术公开了一种互联网广告落地页防篡改方法和系统,其中所述方法包括:建立巡查脚本,其中所述巡查脚本传入到浏览器中,用于巡查检测浏览器中是否存在落地页,需要说明的是,所述巡查脚本插入到无头浏览器中,所述无头浏览器包括puppeteer,通过所述puppeteer执行落地页的巡查操作。
[0025]具体的,所述巡查脚本每天不定时地对浏览器的广告端进行巡查,当巡查到存广告落地页时,所述巡查脚本在所述广告端生成第一落地页链接,所述第一落地页链接发送给所述puppeteer执行截图操作生成第一截图。所述第一截图记载广告落地页第一次巡查的相关信息,所述puppeteer将所述第一截图向云端发送并保存,所述云端在获取所述第一
截图后,采用ocr文字识别模块识别所述第一截图中的文字信息。其中所述云端预设有敏感词数据库,当所述ocr文字识别模块在获取到所述落地页的文字信息后,通过分词技术提取文字信息的关键词,并将关键词和预设的敏感词数据库对比,若所述关键词中存在敏感词数据库中的敏感词,则返回执行落地页下线指令,因此在本实施例中可以有效地识别广告主在广告落地页上采用敏感词吸引用户的违规行为,保障广告落地页的文字表达的纯净。
[0026]当所述第一截图在云端保存并执行敏感词识别处理后,相隔一定时间后,所述巡查脚本再次巡查到相同的落地页,并在广告端生成第二落地页链接,所述第二落地页链接发送给所述puppeteer执行截图操作生成第二截图,所述puppeteer将所述第二截图发送给云端,所述云端在接收到所述第二截图后,进一步采用所述ocr文字识别模块识别所述第二截图中的文字信息,进一步采用分词技术将所述第二截图中文字信息进行关键词提取,将提取的关键词和云端保存的敏感词库对比,若存在敏感词,则执行所述落地页的下线操作。
[0027]当所述第一截图和第二截图均不存在敏感词时,将所述第一截图和第二截图发送给后端,所述后端配置由图片对比服务,所述图片对比服务采本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种互联网广告落地页防篡改方法,其特征在于,所述方法包括如下步骤:建立巡查脚本,将所述巡查脚本插入浏览器定期巡查广告落地页;对当前广告落地页进行截图,并将该截图上传到云端;预设间隔时间,根据所述间隔时间重新巡查所述广告落地页并截图上传到云端;在云端采用图片差异算法计算先后上传的截图差异度,设置差异度阈值,若先后两张截图差异度大于所述差异度阈值,则执行广告落地页的下线操作或进行人工审核。2.根据权利要求1所述的一种互联网广告落地页防篡改方法,其特征在于,所述巡查脚本插入到无头浏览器,并通过puppeteer打开广告落地页执行巡查操作。3.根据权利要求1所述的一种互联网广告落地页防篡改方法,其特征在于,所述先后上传云端的截图包括第一截图和第二截图,其中第一截图先于第二截图上传,所述云端包括ocr文字识别模块,所述第一截图和第二截图在在云端分别识别截图中的文字数据;预设敏感词库,将识别的文字数据和敏感词库对比,若存在敏感词,则执行所述落地页的下线操作。4.根据权利要求1所述的一种互联网广告落地页防篡改方法,其特征在于,所述巡查脚本执行巡查操作包括:打开无头浏览三个窗口,且所述三个窗口的页面数量均等分,在完成三个窗口页面的加载后完成后执行页面的截图操作。5.根据权利要求2所述的一种互联网广告落地页防篡改方法...

【专利技术属性】
技术研发人员:汪忠祥康旭峰郭鹏金韦韦李健
申请(专利权)人:杭州推啊网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1