【技术实现步骤摘要】
过滤第三方网页广告的方法、装置、电子设备及存储介质
本专利技术属于网页分析
,具体涉及一种过滤第三方网页广告的方法、装置、电子设备及存储介质。
技术介绍
随着互联网和信息技术的快速发展,人们与互联网的关系越来越密切,每天都要在终端设备上浏览各种网页。网页主要是将文本格式化的超文本标记语言(HTML)。除了格式化文本之外,网页还可能包含图片、影片、声音和软件元件,这些元件在网页浏览器中以多媒体形式的连贯页面呈现。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:人们在浏览网页的时候经常都会碰到很多网页广告;相比传统媒体,在线广告更方便和经济,但是网页中存在的各种各样的广告有时也会使用户很反感。特别是,大多数的网页广告,为了制造视觉吸引效果,往往会选择放置在网页的显眼位置或者直接遮挡覆盖网页主体内容,对网页浏览者的体验造成极大的影响。特别地,当用户在移动设备上搜索某一关键词并点击搜索结果浏览网页内容时,大部分搜索结果打开后的第三方网页都存在广告。由于移动设备的屏幕较小,手动关闭广告成本较高,并且浪费用户浏览网页的时间和流量,严重地影响了用户体验, ...
【技术保护点】
1.一种过滤第三方网页广告的方法,其特征在于,该方法包括:解析第三方网页并识别出疑似网页广告,提取所述疑似网页广告的特征;利用网页白名单库对识别出的所述疑似网页广告进行修正,得到待过滤广告;对于每个所述待过滤广告,根据所述提取的特征,选择对应的过滤规则进行过滤。
【技术特征摘要】
1.一种过滤第三方网页广告的方法,其特征在于,该方法包括:解析第三方网页并识别出疑似网页广告,提取所述疑似网页广告的特征;利用网页白名单库对识别出的所述疑似网页广告进行修正,得到待过滤广告;对于每个所述待过滤广告,根据所述提取的特征,选择对应的过滤规则进行过滤。2.根据权利要求1所述的方法,其特征在于,所述网页广告包括悬浮广告和贴片广告。3.根据权利要求1所述的方法,其特征在于,所述网页白名单库是预先设定的。4.根据权利要求1所述的方法,其特征在于,所述网页白名单库是通过分析用户行为数据建立的,并定期或实时更新。5.根据权利要求4所述的方法,其特征在于,所述用户行为数据包括用户的点击次数、用户关闭该网页的次数和/或用户浏览该网页的时长的一个或多个用户行为数据。6.根据权利要求1所述的方法,其特征在于,所述过滤规则是从一广告过滤规则库中选择的,所述广告过滤规则库允许用户进行增加、删除、改变或查询过滤规则的操作。7.根据权利要求1所述的方法,其特征在于,所述第三方网页是用户执行搜索后点击搜索结果链接打开的网页。8.一种过滤第三方网页广告的装置,其特征在于,所述装置包括:识别模块,用于解析第三方网页并识别出疑似网页广告,以及提取所述疑似网页广告的特征;修正模块,用于利用网页白名单库对识别出的所述...
【专利技术属性】
技术研发人员:彭睿棋,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。