第三方网页内容审核方法、装置及电子设备制造方法及图纸

技术编号:21571698 阅读:27 留言:0更新日期:2019-07-10 15:27
本发明专利技术实施例公开了一种第三方网页内容审核方法、装置及电子设备、装置及电子设备。其中的方法包括:在第一时刻,模仿用户访问行为,将第三方网页的链接所对应的内容,自动加载在第三方浏览器中;解析所述第三方浏览器的资源获取记录,获取所述第三方网页的资源路径列表并存储;依据所述资源路径列表,获取第一时刻所述第三方网页所对应的资源;所述资源被审核后,若非法,则所述第三方网页的链接被下架。本发明专利技术实施例能够对嵌入的第三方网页链接所对应的内容进行审核,确保第三方网页内容的健康与安全,为当前应用的运营商避免可能产生的不良影响甚至法律风险,保障顺利运营。

Third party web content auditing methods, devices and electronic devices

【技术实现步骤摘要】
第三方网页内容审核方法、装置及电子设备
本专利技术涉及网络安全
,尤其涉及一种第三方网页内容审核方法、装置及电子设备、装置及电子设备。
技术介绍
在某一网页中,经常会嵌入第三方网页的链接,但是,这些链接对应的网页内容是当前网页运行商所不好控制的。若第三方网页的内容违背相关法律法规的要求,有可能会对该当前网页运营商造成不良影响,甚至带来一些法律风险。故,如何高效的对嵌入的第三方网页内容进行审核,是本领域技术人员亟需解决的技术问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种提升第三方网页打开速度的方法、装置及电子设备,至少部分的解决现有技术中存在的问题。第一方面,本专利技术实施例提供了一种第三方网页内容审核方法,包括:在第一时刻,通过模仿用户访问行为,将第三方网页的链接所对应的内容,自动加载在第三方浏览器中;解析所述第三方浏览器的资源获取记录,以获取所述第三方网页的资源路径列表;基于所述资源路径列表,获取所述第一时刻所述第三方网页所对应的资源;响应于所述资源被确定为非法,移除所述第三方网页的链接。根据本专利技术实施例的一种具体实现方式,所述资源通过机器被确定是否合法。根据本专利技术实施例的一种具体实现方式,响应于所述资源被确定为合法,还包括如下步骤:在第二时刻,通过模仿用户访问行为,将第三方网页的链接所对应的内容再次自动加载在所述第三方浏览器中;解析所述第三方浏览器的资源获取记录,以获取所述第三方网页的资源路径列表;基于所述资源路径列表,获取所述第二时刻所述第三方网页所对应的资源;判断所述第二时刻所述第三方网页所对应的资源是否合法;响应于所述第二时刻所述第三方网页所对应的资源非法,移除所述第三方网页的链接。根据本专利技术实施例的一种具体实现方式,判断所述第二时刻所述第三方网页所对应的资源是否合法包括:确定所述第一时刻所述第三方网页所对应的资源的大小和所述第二时刻所述第三方网页所对应的资源的大小是否相同;响应于所述第一时刻所述第三方网页所对应的资源与所述第二时刻所述第三方网页所对应的资源大小相同,确定所述第二时刻所述第三方网页所对应的资源合法。根据本专利技术实施例的一种具体实现方式,响应于所述第一时刻所述第三方网页所对应的资源与所述第二时刻所述第三方网页所对应的资源大小不同,通过机器审核的方式,判断所述第二时刻所述第三方网页所对应的资源是否合法。根据本专利技术实施例的一种具体实现方式,判断所述第二时刻所述第三方网页所对应的资源是否合法包括:采用机器学习方式判断所述第二时刻所述第三方网页所对应的资源是否合法。根据本专利技术实施例的一种具体实现方式,所述第一时刻和所述第二时刻之间的时间间隔预先指定。根据本专利技术实施例的一种具体实现方式,所述第三方网页的资源路径列表包括以下至少一项:Javascript的URL、样式文件的URL、图片的URL以及外部资源的URL,所述外部资源包括字体文件、音频、视频和页内文档中的至少一个。根据本专利技术实施例的一种具体实现方式,所述机器通过以下方式确定所述资源是否合法:从所述资源中进行基于预置关键字的搜索;以及基于搜索结果确定所述资源是否合法。第二方面,本专利技术实施例还提供了一种第三方网页内容审核装置,包括:第一加载模块,用于在第一时刻,通过模仿用户访问行为,将第三方网页的链接所对应的内容,自动加载在第三方浏览器中;第一解析模块,用于解析所述第三方浏览器的资源获取记录,以获取所述第三方网页的资源路径列表;第一资源获取模块,用于基于所述资源路径列表,获取所述第一时刻所述第三方网页所对应的资源;第一移除模块,用于响应于所述资源被确定为非法,移除所述第三方网页的链接。根据本专利技术实施例的一种具体实现方式,所述资源通过机器被确定是否合法。根据本专利技术实施例的一种具体实现方式,所述装置还包括:第二加载模块,用于响应于所述资源被确定为合法,在第二时刻,通过模仿用户访问行为,将第三方网页的链接所对应的内容再次自动加载在所述第三方浏览器中;第二解析模块,用于解析所述第三方浏览器的资源获取记录,以获取所述第三方网页的资源路径列表;第二资源获取模块,用于基于所述资源路径列表,获取所述第二时刻所述第三方网页所对应的资源;第二移除模块,用于判断所述第二时刻所述第三方网页所对应的资源是否合法;并响应于所述第二时刻所述第三方网页所对应的资源非法,移除所述第三方网页的链接。根据本专利技术实施例的一种具体实现方式,所述第二移除模块中还包括:比较单元,用于确定所述第一时刻所述第三方网页所对应的资源的大小和所述第二时刻所述第三方网页所对应的资源的大小是否相同;第一响应单元,用于响应于所述第一时刻所述第三方网页所对应的资源与所述第二时刻所述第三方网页所对应的资源大小相同,确定所述第二时刻所述第三方网页所对应的资源合法。根据本专利技术实施例的一种具体实现方式,第二移除模块还包括:第二响应单元,用于响应于所述第一时刻所述第三方网页所对应的资源与所述第二时刻所述第三方网页所对应的资源大小不同,通过机器审核的方式,判断所述第二时刻所述第三方网页所对应的资源是否合法。根据本专利技术实施例的一种具体实现方式,第二移除模块中,判断所述第二时刻所述第三方网页所对应的资源是否合法包括:采用机器学习方式判断所述第二时刻所述第三方网页所对应的资源是否合法。根据本专利技术实施例的一种具体实现方式,所述第一时刻和所述第二时刻之间的时间间隔预先指定。根据本专利技术实施例的一种具体实现方式,所述第三方网页的资源路径列表包括以下至少一项:Javascript的URL、样式文件的URL、图片的URL以及外部资源的URL,所述外部资源包括字体文件、音频、视频和页内文档中的至少一个。根据本专利技术实施例的一种具体实现方式,所述机器通过以下方式确定所述资源是否合法:从所述资源中提取关键字;以及,基于所述关键字来确定所述资源是否合法。第三方面,本专利技术实施例还提供了一种电子设备,该电子设备包括:至少一个处理器;以及,与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述任第一方面或第一方面的任一实现方式中的第三方网页内容审核方法。第四方面,本专利技术实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的第三方网页内容审核方法。第五方面,本专利技术实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的第三方网页内容审核方法。本专利技术实施例提供的第三方网页内容审核方法、装置及电子设备、非暂态计算机可读存储介质及计算机程序中:第三方网页以某一形式的链接嵌入当前网页时,可以通过第三方浏览器(也可以成为自定义浏览器)模仿用户点击行为,将第三方网页的内容,自动加载在该浏览器中。第三方网页的内容包括,html(网页的主体)、javascript的文件(决定网页的行为,例如各种事件响应,比如click)、样式文件(决定元素的属性,例如,外观、大小),以及,图片、frame、iframe等本文档来自技高网...

【技术保护点】
1.一种第三方网页内容审核方法,其特征在于,包括:在第一时刻,通过模仿用户访问行为,将第三方网页的链接所对应的内容,自动加载在第三方浏览器中;解析所述第三方浏览器的资源获取记录,以获取所述第三方网页的资源路径列表;基于所述资源路径列表,获取所述第一时刻所述第三方网页所对应的资源;响应于所述资源被确定为非法,移除所述第三方网页的链接。

【技术特征摘要】
1.一种第三方网页内容审核方法,其特征在于,包括:在第一时刻,通过模仿用户访问行为,将第三方网页的链接所对应的内容,自动加载在第三方浏览器中;解析所述第三方浏览器的资源获取记录,以获取所述第三方网页的资源路径列表;基于所述资源路径列表,获取所述第一时刻所述第三方网页所对应的资源;响应于所述资源被确定为非法,移除所述第三方网页的链接。2.根据权利要求1所述的方法,其特征在于,所述资源通过机器被确定是否合法。3.根据权利要求1所述的方法,其特征在于,响应于所述资源被确定为合法,还包括如下步骤:在第二时刻,通过模仿用户访问行为,将第三方网页的链接所对应的内容再次自动加载在所述第三方浏览器中;解析所述第三方浏览器的资源获取记录,以获取所述第三方网页的资源路径列表;基于所述资源路径列表,获取所述第二时刻所述第三方网页所对应的资源;判断所述第二时刻所述第三方网页所对应的资源是否合法;响应于所述第二时刻所述第三方网页所对应的资源非法,移除所述第三方网页的链接。4.根据权利要求3所述的方法,其特征在于,判断所述第二时刻所述第三方网页所对应的资源是否合法包括:确定所述第一时刻所述第三方网页所对应的资源的大小和所述第二时刻所述第三方网页所对应的资源的大小是否相同;响应于所述第一时刻所述第三方网页所对应的资源与所述第二时刻所述第三方网页所对应的资源大小相同,确定所述第二时刻所述第三方网页所对应的资源合法。5.根据权利要求4所述的方法,其特征在于,响应于所述第一时刻所述第三方网页所对应的资源与所述第二时刻所述第三方网页所对应的资源大小不同,通过机器审核的方式,判断所述第二时刻所述第三方网页所对应的资源是否合法。6.根据权利要求3所述的方法,其特征在于,判断所述...

【专利技术属性】
技术研发人员:钱宝坤
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1