网页数据的监控方法、装置、终端设备及存储介质制造方法及图纸

技术编号:25802809 阅读:20 留言:0更新日期:2020-09-29 18:36
本申请适用于计算机技术领域,提供了网页数据的监控方法、装置、终端设备及存储介质,包括:获取网页的文档对象类型DOM树,DOM树包含多个DOM节点;对DOM树的各个DOM节点进行分类,得到每个DOM节点的类别特征;若DOM节点的类别特征为预设类别特征,则删除DOM节点。通过分析DOM节点的类别特征,以分析出DOM树的DOM节点是否异常,从而确定网页是否存在异常操作,若存在,则将异常节点删除,进而避免用户通过企业网络违规操作,泄漏企业信息和文件,又避免对一些网站进行全站封锁,造成企业员工生产效率下降;本实施例还基于网页进行监控,而非网络请求,在一定程度上能先知先觉,防范于未然,不必等数据泄漏后再执行封锁。

【技术实现步骤摘要】
网页数据的监控方法、装置、终端设备及存储介质
本申请属于计算机
,尤其涉及网页数据的监控方法、装置、终端设备及存储介质。
技术介绍
对于可以运行多个联网软件的终端来说,浏览器是终端产生联网行为较为频繁和复杂的软件,所以对浏览器联网行为实施监控,是保护终端系统安全的重要部分。当前大部分企业为了防止公司内部文件泄露到外网,采用数据泄密防护(DataLossprevention,DLP)的方式添加黑名单和白名单,并根据黑白名单对网络协议进行过滤。而浏览器访问的网站非常多,发现一个恶意网站需要添加一个黑名单,这样不但操作繁琐,而且无法预先对网站实施监控,监控准确性差。
技术实现思路
本申请实施例提供了网页数据的监控方法、装置、终端设备及存储介质,可以解决当前浏览器联网行为的监控准确性差的问题。第一方面,本申请实施例提供了一种网页数据的监控方法,包括:获取网页的文档对象类型DOM树,DOM树包含多个DOM节点;对DOM树的多个DOM节点进行分类,得到多个DOM节点分别对应的类别特征;若存在DOM节点的类别特征为预设类别特征,则删除预设类别特征对应的DOM节点。本申请实施例监控浏览器所登录的网页的DOM(DocumentObjectModel,文档对象模型)树,当浏览器将企业内部文件向外网发送,或恶意网站窃取企业内部文件时,网页的DOM树会存在异常,因此通过分析DOM节点的类别特征,以分析出DOM树的DOM节点是否异常,从而确定网页是否存在异常操作,若存在,则将异常节点删除,进而避免用户通过企业网络违规操作,泄漏企业信息和文件,又避免对一些网站进行全站封锁,造成企业员工生产效率下降;本实施例还基于网页进行监控,而非网络请求,在一定程度上能先知先觉,防范于未然,不必等数据泄漏后再执行封锁。第二方面,本申请实施例提供了一种网页数据的监控装置,包括:获取模块,用于获取网页的文档对象类型DOM树,DOM树包含多个DOM节点;分类模块,用于对DOM树的多个DOM节点进行分类,得到多个DOM节点分别对应的类别特征;删除模块,用于若存在DOM节点的类别特征为预设类别特征,则删除预设类别特征对应的DOM节点。第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的网页数据的监控方法。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的网页数据的监控方法。第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的网页数据的监控方法。可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请一实施例提供的网页数据的监控方法的流程示意图;图2是本申请一实施例提供的浏览器渲染网页的示意图;图3是本申请一实施例提供的基于HTML的DOM树的示意图;图4是本申请另一实施例提供的网页数据的监控方法的流程示意图;图5是本申请另一实施例提供的网页数据的监控方法的流程示意图;图6是本申请另一实施例提供的网页数据的监控方法的流程示意图;图7是本申请实施例提供的网页数据的监控装置的结构示意图;图8是本申请实施例提供的终端设备的结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。如
技术介绍
相关记载,浏览器登录网页后,用户可能有意或无意将资料外发出去,导致资料泄露。如用户不知道网页中的某张图片被设置为资料提交按钮,用户在浏览网页时无意点击了图片而导致资料提交到外部网络,从而无意泄露资料。目前主要采用数据泄密防护(DataLossprevention,DLP)来监控浏览器所访问的网页,而浏览器访问的网站非常多,发现一个恶意网站需要添加一个黑名单,这样不但操作繁琐,而且无法预先对网站实施监控,导致资料泄露后才对网站进行封锁,监控准确性差。因此,本申请实施例提供一种网页数据的监控方法,实现监控浏览器所登录的网页的DOM树,若DOM树上的DOM节点存在异常,则删除异常节点,从而避免用户通过企业网络违规操作,泄漏企业信息和文件,又避免对一些网站进行全站封锁,造成企业员工生产效率下降;本实施例还基于网页进行监控,而非网络请求,在一定程度上能先知先觉,防范于未然,不必等数据泄漏后再执行封锁。图1示出了本申请提供的网页数据的监控方法的示意性流程图,作为示例而非限定,该方法可以应用于上述终端设备,该终端设备包括但不限于手机、平板电脑、本文档来自技高网
...

【技术保护点】
1.一种网页数据的监控方法,其特征在于,包括:/n获取网页的文档对象类型DOM树,所述DOM树包含多个DOM节点;/n对所述DOM树的多个DOM节点进行分类,得到多个所述DOM节点分别对应的类别特征;/n若存在DOM节点的类别特征为预设类别特征,则删除所述预设类别特征对应的DOM节点。/n

【技术特征摘要】
1.一种网页数据的监控方法,其特征在于,包括:
获取网页的文档对象类型DOM树,所述DOM树包含多个DOM节点;
对所述DOM树的多个DOM节点进行分类,得到多个所述DOM节点分别对应的类别特征;
若存在DOM节点的类别特征为预设类别特征,则删除所述预设类别特征对应的DOM节点。


2.如权利要求1所述的监控方法,其特征在于,所述网页为已访问网页;
相应地,所述获取网页的文档对象类型DOM树,包括:
监控所述已访问网页的DOM节点;
若监控到目标DOM节点发生变化,则获取发生变化的所述目标DOM节点和所述目标DOM节点的关联节点;
根据所述目标DOM节点和所述关联节点构建所述DOM树。


3.如权利要求2所述的监控方法,其特征在于,所述根据所述目标DOM节点和所述关联节点构建所述DOM树,包括:
对所述目标DOM节点和所述关联节点进行层次聚类,得到聚类结果;
根据所述聚类结果构建所述DOM树。


4.如权利要求1所述的监控方法,其特征在于,所述网页为已访问网页;
相应地,获取网页的文档对象类型DOM树,包括:
监控所述已访问网页发出的请求数据;
若所述请求数据为外发数据,则获取所述已访问网页的DOM树。


5.如权利要求1所述的监控方法,其特征在于,所述对所述DOM树的多个DOM节点进行分类,得到多个所述DOM节点分别对应的类别特征,包括:
分析所述DOM树上每个所述DOM节点的所有类别特征的概率值;
对于每个所述DOM节点,将所述概率值大于预设值的类别特征作为所述DOM节点的类别特征。


6.如权利要求5所述的监控方法,其特征在于,所述...

【专利技术属性】
技术研发人员:杨越
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1