一种广告落地页返回作弊检测方法和系统技术方案

技术编号:34484032 阅读:12 留言:0更新日期:2022-08-10 09:01
本发明专利技术公开了一种广告落地页返回作弊检测方法和系统,包括以下步骤:S1、用户点击广告位进入广告主落地页。本发明专利技术用户点击广告位进入广告主落地页,系统平台上的信息采集模块获取85%~95%广告主落地页初始检测页面地址和预期返回地址,分类器将信息传输给系统平台上的PLC信息处理模块进行信息处理,当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%~80%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截,使得再次打开同样的页面时,类似的广告不会重新出现,使用者不需要再次关闭,节约时间和流量的同时给使用者带来了较好的体验。时间和流量的同时给使用者带来了较好的体验。时间和流量的同时给使用者带来了较好的体验。

【技术实现步骤摘要】
一种广告落地页返回作弊检测方法和系统


[0001]本专利技术涉及互联网广告
,具体为一种广告落地页返回作弊检测方法和系统。

技术介绍

[0002]移动互联时代,广告主在广告平台进行广告投放,用户点击广告位进入广告主落地页,互联网广告,是指通过网站、网页、互联网应用程序等互联网媒介,以文字、图片、音频、视频或者其他形式,直接或者间接地推销商品或者提供服务的商业广告,与传统的四大传播媒体(报纸、杂志、电视、广播)广告及备受垂青的户外广告相比,互联网广告具有得天独厚的优势,是实施现代营销媒体战略的重要一部分。Internet是一个全新的广告媒体,速度最快效果很理想,是中小企业扩展壮大的很好途径,对于广泛开展国际业务的公司更是如此。
[0003]现有的互联网广告当使用者点进入之后发现并不是自己感兴趣的广告,对广告关闭之后,当再次打开同样的页面时,类似的广告又会重新出现,使用者需要再次关闭,浪费时间和流量的同时给使用者带来了较差体验,为此,我们提出一种广告落地页返回作弊检测方法和系统用于解决上述问题。

技术实现思路

[0004]本专利技术的目的在于提供一种广告落地页返回作弊检测方法和系统,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种广告落地页返回作弊检测方法,包括以下步骤:S1、用户点击广告位进入广告主落地页;S2、系统平台上的信息采集模块获取85%~95%广告主落地页初始检测页面地址和预期返回地址;S3、系统平台上的信息采集模块筛选80%~90%广告主落地页初始检测页面地址和预期返回地址的重要的特征;S4、利用系统平台上的LDA模型提取作弊网站网页的广告主落地页初始检测页面地址和预期返回地址的主题分布特征,最后将网页的主题分布特征与网页的内容特征相结合来建立分类器;S5、通过分类器将网页的链接特征和网页文本的内容特征结合起来,并分析分类检测出内容与链接相结合的作弊特征;S6、分类器将信息传输给系统平台上的PLC信息处理模块进行信息处理,信息采集模块将检测出内容与链接相结合的作弊方式传输给系统平台上的数据存储模块进行存储;S7、当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%~80%的内容特征相似时,系统
平台上的拦截模块直接对广告位进行拦截。
[0006]进一步优选的,所述S2中信息采集模块获取的信息发送给信息识别模块,信息识别模块根据页面地址及返回地址的重要特征信息将作弊网站识别出,并将其从搜索引擎结果列表中移除。
[0007]进一步优选的,所述S4中分类器采用语言模型KL差异度来描述两个相互链接的网页之间的关系。
[0008]进一步优选的,所述信息识别模块将有用网页的链接在搜索引擎结果列表中排名向前提升3~5位,最终更加方便互联网用户查找有效信息。
[0009]进一步优选的,所述S4中LDA模型预处理完成以后,对最优特征集合进行3~5轮抽样形成3~5个特征子集,最后将3~5个特征子集集成为一个分类器。
[0010]本专利技术还提供了一种广告落地页返回作弊检测系统,所述信息采集模块包括信息获取模块、信息筛分模块,所述信息采集模块与所述数据存储模块连接。
[0011]进一步优选的,所述信息获取模块与所述信息筛分模块连接,所述信息筛分模块与信息识别模块连接。
[0012]进一步优选的,所述数据存储模块与所述信息识别模块连接,所述PLC信息处理模块与拦截模块连接,所述信息识别模块连接与所述PLC信息处理模块连接。
[0013]与现有技术相比,本专利技术的有益效果是:本专利技术用户点击广告位进入广告主落地页,系统平台上的信息采集模块获取85%~95%广告主落地页初始检测页面地址和预期返回地址,分类器将信息传输给系统平台上的PLC信息处理模块进行信息处理,当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%~80%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截,使得再次打开同样的页面时,类似的广告不会重新出现,使用者不需要再次关闭,节约时间和流量的同时给使用者带来了较好的体验。
附图说明
[0014]图1为本专利技术的步骤流程图;图2为本专利技术的系统模块图。
具体实施方式
[0015]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0016]实施例一请参阅图1

2,本专利技术提供一种技术方案:一种广告落地页返回作弊检测方法,包括以下步骤:S1、用户点击广告位进入广告主落地页;S2、系统平台上的信息采集模块获取85%广告主落地页初始检测页面地址和预期返回地址;
S3、系统平台上的信息采集模块筛选80%广告主落地页初始检测页面地址和预期返回地址的重要的特征;S4、利用系统平台上的LDA模型提取作弊网站网页的广告主落地页初始检测页面地址和预期返回地址的主题分布特征,最后将网页的主题分布特征与网页的内容特征相结合来建立分类器;S5、通过分类器将网页的链接特征和网页文本的内容特征结合起来,并分析分类检测出内容与链接相结合的作弊特征;S6、分类器将信息传输给系统平台上的PLC信息处理模块进行信息处理,信息采集模块将检测出内容与链接相结合的作弊方式传输给系统平台上的数据存储模块进行存储;S7、当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截。
[0017]本实施例中,具体的:S2中信息采集模块获取的信息发送给信息识别模块,信息识别模块根据页面地址及返回地址的重要特征信息将作弊网站识别出,并将其从搜索引擎结果列表中移除。
[0018]本实施例中,具体的:S4中分类器采用语言模型KL差异度来描述两个相互链接的网页之间的关系。
[0019]本实施例中,具体的:信息识别模块将有用网页的链接在搜索引擎结果列表中排名向前提升3位,最终更加方便互联网用户查找有效信息。
[0020]本实施例中,具体的:S4中LDA模型预处理完成以后,对最优特征集合进行3轮抽样形成3个特征子集,最后将3个特征子集集成为一个分类器。
[0021]本专利技术还提供了一种广告落地页返回作弊检测系统,信息采集模块包括信息获取模块、信息筛分模块,信息采集模块与数据存储模块连接。
[0022]本实施例中,具体的:信息获取模块与信息筛分模块连接,信息筛分模块与信息识别模块连接。
[0023]本实施例中,具体的:数据存储模块与信息识别模块连接,PLC信息处理模块与拦截模块连接,信息识别模块连接与PLC信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种广告落地页返回作弊检测方法,其特征在于:包括以下步骤:S1、用户点击广告位进入广告主落地页;S2、系统平台上的信息采集模块获取85%~95%广告主落地页初始检测页面地址和预期返回地址;S3、系统平台上的信息采集模块筛选80%~90%广告主落地页初始检测页面地址和预期返回地址的重要的特征;S4、利用系统平台上的LDA模型提取作弊网站网页的广告主落地页初始检测页面地址和预期返回地址的主题分布特征,最后将网页的主题分布特征与网页的内容特征相结合来建立分类器;S5、通过分类器将网页的链接特征和网页文本的内容特征结合起来,并分析分类检测出内容与链接相结合的作弊特征;S6、分类器将信息传输给系统平台上的PLC信息处理模块进行信息处理,信息采集模块将检测出内容与链接相结合的作弊方式传输给系统平台上的数据存储模块进行存储;S7、当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%~80%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截。2.根据权利要求1所述的一种广告落地页返回作弊检测方法,其特征在于:所述S2中信息采集模块获取的信息发送给信息识别模块,信息识别模块根据页面地址及返回地址的重要特征信息将作弊网站识别...

【专利技术属性】
技术研发人员:李昆黄春阳
申请(专利权)人:南京合宜信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1