基于浏览器插件筛选网页信息的方法及系统技术方案

技术编号:34251437 阅读:33 留言:0更新日期:2022-07-24 11:38
本发明专利技术公开了一种基于浏览器插件筛选网页信息的方法及系统,其中该方法包括:创建可插入浏览器的插件,插件用于监听网页DOM树的所有DOM节点,并分析DOM节点中的内容;将插件加载到浏览器中;通过插件监听鼠标所停留位置处的网页内的DOM节点,并判断该DOM节点是否存在CSS文本控制,CSS文本控制用于阻止将网页内的文本内容添加进鼠标的选择集中,如果是,则绕过该CSS文本控制程序,并获取该DOM节点中的文本内容;当鼠标执行选择复制功能时,插件将当前鼠标所在位置处DOM节点中的文本内容置入粘贴板;通过上述方法,可简单、快速获取网页内的内容,没有技术门槛,而且,即使在设置有CSS文本控制的网页中也可获取到所需文本内容,有效提高使用体验感。效提高使用体验感。效提高使用体验感。

Method and system of filtering web information based on browser plug-in

【技术实现步骤摘要】
基于浏览器插件筛选网页信息的方法及系统


[0001]本专利技术涉及网络信息获取
,尤其涉及一种基于浏览器插件筛选网页信息的方法及系统。

技术介绍

[0002]当前想要通过技术手段获取并过滤出不同网站上的内容信息,一般是通过爬虫的方法来实现,通过发送http请求,抓取页面html Dom树,分析出想要获取的资源并取出。但是爬虫技术也有自己的不足之处,一是,对使用者的要求相对较高,操作性上不够友好。爬虫是爬取网页内容的一段脚本,对于不同的网页要爬取的内容的不同,使用者需要能够理解并适当的修改脚本,调整爬取规则。二是,对于越来越多的PWA(单页面)应用,爬虫的爬取效果不甚理想。另外,近来,越来越多的网页上设置有CSS文本控制,以阻止用户复制页面上的文本内容,使得用户只能通过截图的方式保存所要的内容,因此,用户想要一种可绕过CSS文本控制的网页信息获取方式,以提高信息收集效率。

技术实现思路

[0003]本专利技术的目的是提供一种用于网页文本信息内容获取的可有效降低使用门槛且可避免因设置CSS文本控制而无法复制的基于浏览器插件筛选网页信息的方法及系统。
[0004]为了实现上述目的,本专利技术公开了一种基于浏览器插件筛选网页信息的方法,其包括:
[0005]创建可插入浏览器的插件,所述插件用于监听网页DOM树的所有DOM节点,并分析所述DOM节点中的内容;
[0006]将所述插件加载到浏览器中;
[0007]通过所述插件监听鼠标所停留位置处的网页内的DOM节点,并判断该DOM节点是否存在CSS文本控制,所述CSS文本控制用于阻止将所述网页内的文本内容添加进鼠标的选择集中,如果是,则绕过该CSS文本控制程序,并获取该DOM节点中的文本内容;
[0008]当鼠标执行选择复制功能时,所述插件将当前鼠标所在位置处DOM节点中的文本内容置入粘贴板。
[0009]较佳地,当鼠标停留在网页中某一DOM节点时,高亮显示该DOM节点所对应的文本内容。
[0010]较佳地,在所述插件中,还可设置目标网页的地址和所述目标网页内所要获取内容所处DOM节点的路径,以定期自动获取所述目标网页内所要获取的内容。
[0011]较佳地,所述插件中设置有用于自动获取配置的对话框,在所述对话框中可配置所述目标网页的地址和所述目标网页内所要获取内容所处DOM节点的路径。
[0012]本专利技术还公开一种基于浏览器插件筛选网页信息的系统,其包括插件创建模块、加载模块、监听模块和获取模块;
[0013]所述插件创建模块,用于创建可插入浏览器的插件,所述插件用于监听鼠标于网
页内所对应的DOM节点,并分析所述DOM节点中的内容;
[0014]所述加载模块,用于将所述插件加载到浏览器中;
[0015]所述监听模块,用于通过所述插件监听鼠标所停留位置处的网页内的DOM节点,并判断该DOM节点是否存在CSS文本控制,所述CSS文本控制用于阻止将所述网页内的文本内容添加进鼠标的选择集中,如果是,则绕过该CSS文本控制程序,并获取该DOM节点中的文本内容;
[0016]所述获取模块,用于将当前鼠标所在位置处DOM节点中的文本内容置入粘贴板。
[0017]较佳地,还包括标记模块,所述标记模块用于高亮显示鼠标所在位置处DOM节点所对应的文本内容。
[0018]较佳地,还包括配置模块,所述配置模块用于在所述插件中配置目标网页的地址和所述目标网页内所要获取内容所处DOM节点的路径,以定期自动获取所述目标网页内所要获取的内容。
[0019]较佳地,所述配置模块中设置有用于自动获取配置的对话框,在所述对话框中可配置所述目标网页的地址和所述目标网页内所要获取内容所处DOM节点的路径。
[0020]本专利技术还公开另一种基于浏览器插件筛选网页信息的系统,其包括:
[0021]一个或多个处理器;
[0022]存储器;
[0023]以及一个或多个程序,其中一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行上所述的基于浏览器插件筛选网页信息的方法的指令。
[0024]本专利技术还公开一种计算机可读存储介质,其包括计算机程序,所述计算机程序可被处理器执行以完成如上所述的基于浏览器插件筛选网页信息的方法。
[0025]与现有技术相比,本专利技术筛选网页信息的方法,创建了用于监听鼠标移动到网页不同位置所对应不同的DOM节点的插件,使用时,只需将该插件加载到浏览器中,然后当将鼠标放置到目标内容所在位置处时,插件对该位置处的DOM节点进行检测,以判断是否存在CSS文本控制,如果存在的话,那么只需绕过该CSS文本控制程序的动作,然后将该DOM节点处的文本内容添加进粘贴板中,从而快速获取到目标内容;由此可知,通过上述方法,可简单、快速获取网页内的内容,没有技术门槛,而且,即使在设置有CSS文本控制的网页中也可获取到所需文本内容,有效提高使用体验感。
附图说明
[0026]图1为本专利技术实施例中基于浏览器插件筛选网页信息的方法流程图。
具体实施方式
[0027]为详细说明本专利技术的
技术实现思路
、构造特征、所实现目的及效果,以下结合实施方式并配合附图详予说明。
[0028]本实施例公开了一种基于浏览器插件筛选网页信息的方法,以用于在浏览器的网页内获取文本信息,如图1,该方法包括如下步骤:
[0029]S1:创建可插入浏览器的插件,插件用于监听鼠标于网页内所对应的DOM节点,并
分析DOM节点中的内容;
[0030]S2:将插件加载到浏览器中;
[0031]S3:通过插件监听鼠标所停留位置处的网页内的DOM节点,并判断该DOM节点是否存在CSS文本控制,CSS文本控制用于阻止将网页内的文本内容添加进鼠标的选择集中,如果否,则执行S5,如果是,则执行S4;
[0032]S4:绕过该CSS文本控制程序;
[0033]S5:获取该DOM节点中的文本内容;
[0034]S6:当鼠标执行选择复制功能时,插件将当前鼠标所在位置处DOM节点中的文本内容置入粘贴板。
[0035]通过上述方法,由于在浏览器中加载有用于监听鼠标移动到网页不同位置所对应不同的DOM节点的插件,使用时,当将鼠标放置到目标内容所在位置处时,插件对该位置处的DOM节点进行检测,以判断是否存在CSS文本控制,如果存在的话,那么只需绕过该CSS文本控制程序的动作,然后将该DOM节点处的文本内容添加进粘贴板中,从而快速获取到目标内容。通过上述方法,可简单、快速获取网页内的内容,没有技术门槛,而且,即使在设置有CSS文本控制的网页中也可获取到所需文本内容,有效提高使用体验感。
[0036]进一步地,插件中还设置有提示功能,即当鼠标停留在网页中某一DOM节点时,高亮显示该DOM节点所对应的文本内容,以提醒用户当前所选取的目标内容。
[0037]更进一步地,在插件中,还可设置目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于浏览器插件筛选网页信息的方法,其特征在于,包括:创建可插入浏览器的插件,所述插件用于监听鼠标于网页内所对应的DOM节点,并分析所述DOM节点中的内容;将所述插件加载到浏览器中;通过所述插件监听鼠标所停留位置处的网页内的DOM节点,并判断该DOM节点是否存在CSS文本控制,所述CSS文本控制用于阻止将所述网页内的文本内容添加进鼠标的选择集中,如果是,则绕过该CSS文本控制程序,并获取该DOM节点中的文本内容;当鼠标执行选择复制功能时,所述插件将当前鼠标所在位置处DOM节点中的文本内容置入粘贴板。2.根据权利要求1所述的基于浏览器插件筛选网页信息的方法,其特征在于,当鼠标停留在网页中某一DOM节点时,高亮显示该DOM节点所对应的文本内容。3.根据权利要求1所述的基于浏览器插件筛选网页信息的方法,其特征在于,在所述插件中,还可设置目标网页的地址和所述目标网页内所要获取内容所处DOM节点的路径,以定期自动获取所述目标网页内所要获取的内容。4.根据权利要求3所述的基于浏览器插件筛选网页信息的方法,其特征在于,所述插件中设置有用于自动获取配置的对话框,在所述对话框中可配置所述目标网页的地址和所述目标网页内所要获取内容所处DOM节点的路径。5.一种基于浏览器插件筛选网页信息的系统,其特征在于,包括插件创建模块、加载模块、监听模块和获取模块;所述插件创建模块,用于创建可插入浏览器的插件,所述插件用于监听鼠标于网页内所对应的DOM节点,并分析所述DOM节点中的内容;所述加载模块,用于将所述插件加载到浏览器中;所述监听模块,用于...

【专利技术属性】
技术研发人员:吴迪万振华王颉李华董燕
申请(专利权)人:深圳开源互联网安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1