恶意曝光广告行为的检测方法、装置、存储介质及终端制造方法及图纸

技术编号:26260466 阅读:21 留言:0更新日期:2020-11-06 17:56
本申请实施例公开了一种恶意曝光广告行为的检测方法、装置、存储介质及终端,其中该检测方法包括:基于待检测文章的页面数据进行页面渲染,生成目标页面;获取目标页面的效果图中文本内容的显示占用面积;计算待检测文章中文本内容的实际占用面积;比较显示占用面积和实际占用面积,以确定待检测文章是否恶意曝光广告。本申请方案可有效提升文章中广告侦测的准确性。

【技术实现步骤摘要】
恶意曝光广告行为的检测方法、装置、存储介质及终端
本申请涉及信息处理
,具体涉及一种恶意曝光广告行为的检测方法、装置、存储介质及终端。
技术介绍
随着互联网的发展和移动通信网络的发展,广告植入的方式和表现形式也越来越多。相关技术中,可以通过在某些流量较大的文章、资讯、视频等植入广告进行宣传。例如,以一种常见的以曝光量为标准的广告计费方式CPM(CostPerMille)广告为例,其按照每千人看过此广告来收费。在某些平台内注册的账户发布的文章,只要超过一定字数且文字内容和平台所有历史文章未有相似之处,即可申请原创文章。由于平台给予原创文章的广告分成比例比大大高于普通文章。因此有些不良账户,让原创文章底部的广告尽可能的向顶端前置,使文章在享受原创高广告分成的同时还恶意曝光广告,加大了公众平台中维护文章质量的难度。
技术实现思路
本申请实施例提供一种恶意曝光广告行为的检测方法、装置、存储介质及终端,可有效提升文章中广告侦测的准确性。本申请实施例提供了一种恶意曝光广告行为的检测方法,应用于客户端,包括:基于待检测文章的页面数据进行页面渲染,生成目标页面;获取所述目标页面的效果图中文本内容的显示占用面积;计算所述待检测文章中文本内容的实际占用面积;比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告。相应的,本申请实施例还提供了一种恶意曝光广告行为的检测装置,应用于客户端,包括:渲染单元,用于基于待检测文章的页面数据进行页面渲染,生成目标页面;获取单元,用于获取所述目标页面的效果图中文本内容的显示占用面积;计算单元,用于计算所述待检测文章中文本内容的实际占用面积;确定单元,用于比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告。相应的,本申请实施例还提供了一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行如上所述方法中的步骤。一种终端,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上所述方法中的步骤。本申请实施例中,通过比较文章对应渲染成显示页面后的效果图中文本内容的展示面积、及文本内容实际占用的面积,来判定效果图中是否隐藏了文字区域。以此确定该文章是否恶意曝光广告,提升了广告侦测的准确性。可直接侦测恶意曝光广告的账户,进而限制某些账户恶意曝光广告的行为,提升交流平台中的文章质量。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的恶意曝光广告行为的检测方法的流程示意图。图2是本申请实施例提供的恶意曝光广告行为的检测方法的另一流程示意图。图3是本申请实施例提供的恶意曝光广告行为的检测方法的应用场景示意图。图4是本申请实施例提供的待检测文章的局部页面的展示效果图。图5是本申请实施例提供的恶意曝光广告行为的检测装置的结构示意图。图6是本申请实施例提供的终端的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例提供一种恶意曝光广告行为的检测方法、装置、存储介质及终端。其中,该恶意曝光广告行为的检测装置具体可以集成在平板PC(PersonalComputer)、手机等具备储存单元并安装有微处理器而具有运算能力的终端机中。按照某些公众平台的规定,在该平台内注册的账户发布的文章,只要超过一定字数且文字内容和平台所有历史文章未有相似之处,即可申请原创文章(表现形式是在文章标题下方打上“原创”两字的标签)。由于平台给予原创文章的广告分成比例比大大高于普通文章。因此滋生出一批不良账户,发布原创文章后又利用前端网页技术在页面展示阶段隐藏文章文字,从代码上控制内容排版导致异常曝光。例如,修改字体大小为0、内容不占排版篇幅;改排版格式,让文本内容和广告重叠;修改文本框大小,使其变的很小等方式,都能让广告前置。这样既获取了原创认证又消除了原创文章带来的长篇幅展示(原创文章认证对文本字数有要求)问题,从而让文章底部的广告尽可能的向顶端前置。使文章在享受原创高广告分成的同时还恶意曝光广告,极度加大了公众平台中维护文章质量的难度。相关技术中,通过解析文章的网页代码去发现异常曝光,这是一种强规则的解决方案,很容易被多种方案绕过,需要时刻的补充新规则,维护成本非常大,并且无法保证有新情况后能立马发现。有基于此,本申请实施例提供一种恶意曝光广告行为的检测方法,应用于客户端,该方法包括:基于待检测文章的页面数据进行页面渲染,生成目标页面;获取目标页面的效果图中文本内容的显示占用面积;计算待检测文章中文本内容的实际占用面积;比较显示占用面积和实际占用面积,以确定待检测文章是否恶意曝光广告。以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。需要说明的是,该客户端为可发布消息(如文章)并能供不同用户查看、评论、转载等操作的信息交流平台。请参阅图1至图4。图1为本申请实施例提供的恶意曝光广告行为的检测方法的流程示意图。该恶意曝光广告行为的检测方法的具体流程可以如下:101、基于待检测文章的页面数据进行页面渲染,生成目标页面。本申请实施例中,需要调用浏览器内核进行页面渲染。其中,页面数据可以为HTML文件,包含了描述浏览器所需的信息(如配置信息)、及最终显示的具体内容(如文本内容、图片内容、视频内容及相关控件等)。具体的,调用浏览器内核API接口解析HTML结构,读取接收到的HTML二进制数据,按指定编码格式将字节转换为HTML字符,完成文档对象模型(DOM,documentobjectmodel)的构建。然后执行样式重新计算,将层叠样式表(CSS,cascadingstylesheets)附着于文档对象模型上,以创建渲染树(Rendertree)。渲染树是一些被渲染对象的集,每个渲染对象都包含了与之对应的计算过样式的文档对象模型,对于每个渲染元素来说,位置都经过计算,形成布局文件。然后通过布局文件将渲染树显示在视图控件上,并将文本、图片、视频等外部资源加载到相应位置进行显示,从而生成目标页面。需要说明的是,本申请实施例中的待检测文章至少需包含文本内容,对图片及视频则可以不作要求。102、获取目标页面的效果图中文本内容的显示占用面积。其中,目标页面的效果图指最终呈现、并可在客户端显示界面本文档来自技高网...

【技术保护点】
1.一种恶意曝光广告行为的检测方法,应用于客户端,其特征在于,包括:/n基于待检测文章的页面数据进行页面渲染,生成目标页面;/n获取所述目标页面的效果图中文本内容的显示占用面积;/n计算所述待检测文章中文本内容的实际占用面积;/n比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告。/n

【技术特征摘要】
1.一种恶意曝光广告行为的检测方法,应用于客户端,其特征在于,包括:
基于待检测文章的页面数据进行页面渲染,生成目标页面;
获取所述目标页面的效果图中文本内容的显示占用面积;
计算所述待检测文章中文本内容的实际占用面积;
比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告。


2.根据权利要求1所述的恶意曝光广告行为的检测方法,其特征在于,所述获取所述目标页面的效果图中文本内容的显示占用面积,包括:
对所述效果图进行预处理,得到所述效果图的内容轮廓图;
对所述内容轮廓图进行膨胀处理和腐蚀处理的多次交替,得到处理后的内容轮廓图;
从所述处理后的内容轮廓图中识别文字区域;
基于所述文字区域确定所述文本内容的显示占用面积。


3.根据权利要求2所述的恶意曝光广告行为的检测方法,其特征在于,所述从所述处理后的内容轮廓图中识别文字区域,包括:
从所述页面数据中获取文本内容的排版信息和字号信息;
根据所述排版信息和字号信息,确定展示所述文本内容时展示区域的呈现形态;
基于所述展示区域的呈现形态,从所述处理后的内容轮廓图中识别文字区域。


4.根据权利要求2所述的恶意曝光广告行为的检测方法,其特征在于,所述基于所述文字区域确定所述文本内容的显示占用面积,包括
获取所述文字区域对应在所述客户端中占用的第一像素点数量;
根据所述第一像素点数量确定所述文本内容的显示占用面积。


5.根据权利要求1所述的恶意曝光广告行为的检测方法,其特征在于,所述计算所述待检测文章中文本内容的实际占用面积,包括:
从所述页面数据中提取文字属性,所述文字属性至少包括:字体、字号和文字数量;
根据所述字体、字号和文字数量,计算待检测文章中文字在所述客户端中占用的第二像素点数量;
根据所述第二像素点数量确定所述文本内容的实际占用面积。


6.根据权利要求1所述的恶意曝光广告行为的检测方法,其特征在于,在生成目标页面之后,获取所述目标页面的效果图中文本内容的显示占用面积之前,还包括:
在展示所述目标页面的过程中,抓取所述客户端呈现的画面;
判断呈现的画面是否发生变化;
若是,则执行获取所述目标页面的效果图中文本内容的显示占用面积的步骤。


7.根据权利要求1-6任一项所述的恶意曝光广告行为的检测方法,其特征在于,所述比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告,包括:
计算所述显示占用面积与所述实际占用面积之间的比值;
判断所述比值是否小于预设比值;
若是,则判定所述待...

【专利技术属性】
技术研发人员:白帆
申请(专利权)人:广州腾讯科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1