【技术实现步骤摘要】
恶意曝光广告行为的检测方法、装置、存储介质及终端
本申请涉及信息处理
,具体涉及一种恶意曝光广告行为的检测方法、装置、存储介质及终端。
技术介绍
随着互联网的发展和移动通信网络的发展,广告植入的方式和表现形式也越来越多。相关技术中,可以通过在某些流量较大的文章、资讯、视频等植入广告进行宣传。例如,以一种常见的以曝光量为标准的广告计费方式CPM(CostPerMille)广告为例,其按照每千人看过此广告来收费。在某些平台内注册的账户发布的文章,只要超过一定字数且文字内容和平台所有历史文章未有相似之处,即可申请原创文章。由于平台给予原创文章的广告分成比例比大大高于普通文章。因此有些不良账户,让原创文章底部的广告尽可能的向顶端前置,使文章在享受原创高广告分成的同时还恶意曝光广告,加大了公众平台中维护文章质量的难度。
技术实现思路
本申请实施例提供一种恶意曝光广告行为的检测方法、装置、存储介质及终端,可有效提升文章中广告侦测的准确性。本申请实施例提供了一种恶意曝光广告行为的检测方法,应用于客户端,包括:基于待检测文章的页面数据进行页面渲染,生成目标页面;获取所述目标页面的效果图中文本内容的显示占用面积;计算所述待检测文章中文本内容的实际占用面积;比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告。相应的,本申请实施例还提供了一种恶意曝光广告行为的检测装置,应用于客户端,包括:渲染单元,用于基于待检测文章的页面数据进行页面渲染, ...
【技术保护点】
1.一种恶意曝光广告行为的检测方法,应用于客户端,其特征在于,包括:/n基于待检测文章的页面数据进行页面渲染,生成目标页面;/n获取所述目标页面的效果图中文本内容的显示占用面积;/n计算所述待检测文章中文本内容的实际占用面积;/n比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告。/n
【技术特征摘要】
1.一种恶意曝光广告行为的检测方法,应用于客户端,其特征在于,包括:
基于待检测文章的页面数据进行页面渲染,生成目标页面;
获取所述目标页面的效果图中文本内容的显示占用面积;
计算所述待检测文章中文本内容的实际占用面积;
比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告。
2.根据权利要求1所述的恶意曝光广告行为的检测方法,其特征在于,所述获取所述目标页面的效果图中文本内容的显示占用面积,包括:
对所述效果图进行预处理,得到所述效果图的内容轮廓图;
对所述内容轮廓图进行膨胀处理和腐蚀处理的多次交替,得到处理后的内容轮廓图;
从所述处理后的内容轮廓图中识别文字区域;
基于所述文字区域确定所述文本内容的显示占用面积。
3.根据权利要求2所述的恶意曝光广告行为的检测方法,其特征在于,所述从所述处理后的内容轮廓图中识别文字区域,包括:
从所述页面数据中获取文本内容的排版信息和字号信息;
根据所述排版信息和字号信息,确定展示所述文本内容时展示区域的呈现形态;
基于所述展示区域的呈现形态,从所述处理后的内容轮廓图中识别文字区域。
4.根据权利要求2所述的恶意曝光广告行为的检测方法,其特征在于,所述基于所述文字区域确定所述文本内容的显示占用面积,包括
获取所述文字区域对应在所述客户端中占用的第一像素点数量;
根据所述第一像素点数量确定所述文本内容的显示占用面积。
5.根据权利要求1所述的恶意曝光广告行为的检测方法,其特征在于,所述计算所述待检测文章中文本内容的实际占用面积,包括:
从所述页面数据中提取文字属性,所述文字属性至少包括:字体、字号和文字数量;
根据所述字体、字号和文字数量,计算待检测文章中文字在所述客户端中占用的第二像素点数量;
根据所述第二像素点数量确定所述文本内容的实际占用面积。
6.根据权利要求1所述的恶意曝光广告行为的检测方法,其特征在于,在生成目标页面之后,获取所述目标页面的效果图中文本内容的显示占用面积之前,还包括:
在展示所述目标页面的过程中,抓取所述客户端呈现的画面;
判断呈现的画面是否发生变化;
若是,则执行获取所述目标页面的效果图中文本内容的显示占用面积的步骤。
7.根据权利要求1-6任一项所述的恶意曝光广告行为的检测方法,其特征在于,所述比较所述显示占用面积和所述实际占用面积,以确定所述待检测文章是否恶意曝光广告,包括:
计算所述显示占用面积与所述实际占用面积之间的比值;
判断所述比值是否小于预设比值;
若是,则判定所述待...
【专利技术属性】
技术研发人员:白帆,
申请(专利权)人:广州腾讯科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。