一种网页关键词定位检索方法技术

技术编号:35735231 阅读:15 留言:0更新日期:2022-11-26 18:37
本发明专利技术公开了一种网页关键词定位检索方法,其特征在于,配置Chrome Extensions的扩展模块,扩展模块通过轮询探针和接口监听与搜索模块相连,对目标网页数据动态加载监听、自动定位检索和重新渲染网页;配置搜索模块,通过Http协议进行通信,包括搜索服务层与搜索平台,根据扩展模块传过来的目标网页关键词的参数进行检索,将检索结果回传扩展模块。可以达到目标关键词检索结果实时页面反馈,扩展用户浏览体验;解决ChromeExtensions V3引擎webRequest的不支持问题;全自动化流程,无需用户手动触发,极大提高生产力,模块之间的解耦,可根据实际的业务要求替换搜索平台等有益效果。效果。效果。

【技术实现步骤摘要】
一种网页关键词定位检索方法


[0001]本专利技术涉及计算机处理技术和WEB网页处理领域,特别是涉及一种网页关键词定位检索方法。

技术介绍

[0002]随着网络技术以及信息传播技术的高速发展,网页信息浏览已成为人们日常信息获取的重要途径。但如何在海量以及良莠不齐的网页信息中,快速高效的甄别自身所需信息,是提高生产力的核心所在。
[0003]现有的公开技术中,Chrome浏览器官方提供了关键词定位功能扩展,并集成在自家的浏览器产品中。但基于现有应用的效果依旧远达不到上述所提到的核心需求,其主要缺点如下:
[0004]无法自动化:Chrome浏览器所提供的关键词定位功能只能由用户手动触发,即用户输入需要定位的关键词后手动触发网页信息定位。当用户在进行多次、大规模的网页浏览时,重复的手动触发反而会降低浏览效率;
[0005]无法数据交互:Chrome浏览器所提供的关键词定位功能只是单纯的定位功能,无后续流程。无法满足用户在定位关键词后,后续的一些数据检索需求,实际的后续流程还需用户手动操作。
[0006]丰富化程度低:Chrome浏览器所提供的关键词定位功能目前只能将定位出来的关键词高亮显示,无法扩展页面,从而无法满足用户的定制化浏览需求。
[0007]因此,需要一种用户体验更好的网页关键词定位检索方法。

技术实现思路

[0008]本专利技术所要解决的技术问题是克服现有技术的不足,提供一种基于Chrome Extensions 和搜索平台协同的网页关键词定位检索方法,是针对提高网页信息浏览效率这一目的所做的一次创新实践。本专利技术包含两个核心部分:其一为依托Chrome提供的Chrome ExtensionsOpenApi完成对Chrome浏览器网页特定关键词的快速定位以及后续的数据交互,网页重新渲染等;其二则为特定业务场景下的数据快速检索,所涉及的搜索平台根据具体业务而定。通过对Chrome Extensions OpenApi的组合以及与搜索平台的相互协同,从而达到用户通过配置自定义定位规则,完成对Chrome浏览器网页重新渲染,扩展用户浏览体验。
[0009]为解决上述技术问题,本专利技术提供一种网页关键词定位检索方法,其特征在于,包括以下步骤:
[0010]步骤1:配置Chrome Extensions的扩展模块,所述扩展模块通过目标节点的轮询探针和MutationObserver接口监听与搜索模块相连,用以对目标网页数据动态加载监听、自动定位检索和重新渲染网页,所述扩展模块包括清单文件、用户界面、后台服务和内容脚本,所述清单文件用于向浏览器提供扩展的信息,包括扩展的版本和拓展所需主机权限;所
述用户界面用于用户自定义扩展规则;所述后台服务用于处理扩展的事件程序,利用ChromeExtensions提供的API完成对浏览器的扩展;所述内容脚本用于将逻辑脚本注入目标网页用以读取和修改其内容,所述后台服务包括浏览器页签控制、浏览器本地缓存控制、浏览器导航栏控制、浏览器cookie控制和浏览器定时调度控制;
[0011]步骤2:配置搜索模块,所述扩展模块与搜索模块通过Http协议进行通信,所述搜索模块包括搜索服务层与搜索平台,根据扩展模块传过来的目标网页关键词的参数,通过预设的业务检索规则检索,将检索结果回传扩展模块。
[0012]所述步骤1中,所述ChromeExtensions的扩展模块基于HTML、JavaScript和CSS,配置的具体步骤如下:
[0013]步骤1

1:所述清单文件为一个用于描述扩展的所有元数据的JSON格式化的文件,所述扩展所需主机权限通过对主机权限的申请以达到控制扩展浏览器;
[0014]步骤1

2:所述用户界面包括一个用于预设规则的弹窗的HTML文件,所述预设规则包括用户配置自定义开启监听的目标网页、目标网页关键词定位、目标网页数据动态加载监听和后续自动触发定位检索的规则,所述用户配置自定义开启监听的目标网页记为目标网页URL,所述目标网页关键词定位记为目标网页关键词所在XPath坐标,所述目标网页数据动态加载监听记为目标网页数据动态加载的中间状态XPath坐标,所述后续自动触发定位检索的规则记为目标网页数据动态加载的完毕条件;
[0015]步骤1

3:所述后台服务为一段JavaScript脚本,读取步骤1

2配置的预设规则并加载至内存中,根据目标网页URL,调用后台服务的浏览器导航栏控制,所述浏览器导航栏控制包括调用ChromeExtensions提供的chrome.webNavigationAPI中的onCompleted事件,监听浏览器页签是否加载目标网页URL,如是,则触发后续步骤;
[0016]步骤1

4:调用后台服务的浏览器页签控制控制,所述浏览器页签控制控制包括调用ChromeExtensions提供的chrome.tabs.sendMessageAPI与内容脚本通信,请求对目标网页监听;
[0017]步骤1

5:所述内容脚本包括一段JavaScript脚本,通过JavaScript提供的setInterval手动实现轮询重试,根据中间状态Xpath坐标,60秒内轮询判断当前页面是否发生数据动态加载操作,所述数据动态加载操作包括筛选条件变更、点击下一页和刷新当前页面,如检测到数据动态加载操作,则调用JavaScript的DOM3事件提供的MutationObserver接口,预设监听属性配置,所述监听属性配置包括节点属性变化、子节点变化和节点数据变化,完成对目标网页的目标节点的DOM结构变化监听;如轮询超时,未检测到数据动态加载操作,页面无反馈;
[0018]步骤1

6:如监听到目标节点的DOM结构变化,根据目标网页数据动态加载的完毕条件,从当前DOM结构变化中筛选出数据动态加载完毕的状态,根据目标网页关键词所在XPath坐标,用JavaScript提供的JQuery类库对目标网页关键词进行定位,并提取目标网页关键词以及相应的XPath坐标;
[0019]步骤1

7:调用chrome.tabs.sendMessageAPI与后台服务通信,后台服务通过Fetch向搜索模块发送Http请求用以传送网页提取目标网页关键词;
[0020]步骤1

8:所述扩展模块接收请求数据,调用chrome.tabs.sendMessageAPI与内容脚本通信,重复步骤1

5设置新一轮监听,用以自动触发定位检索动作;
[0021]步骤1

9:关联步骤1

6中定位提取的目标网页关键词与步骤1

8获取的检索结果,根据关联关系拼接重新渲染网页所需的Html脚本,用JQuery类库将Html脚本插入目标网页关键词所在Xpath坐标,重本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网页关键词定位检索方法,其特征在于,包括以下步骤:步骤1:配置Chrome Extensions的扩展模块,所述扩展模块通过目标节点的轮询探针和MutationObserver接口监听与搜索模块相连,用以对目标网页数据动态加载监听、自动定位检索和重新渲染网页,所述扩展模块包括清单文件、用户界面、后台服务和内容脚本,所述清单文件用于向浏览器提供扩展的信息,包括扩展的版本和拓展所需主机权限;所述用户界面用于用户自定义扩展规则;所述后台服务用于处理扩展的事件程序,利用Chrome Extensions提供的API完成对浏览器的扩展;所述内容脚本用于将逻辑脚本注入目标网页用以读取和修改其内容,所述后台服务包括浏览器页签控制、浏览器本地缓存控制、浏览器导航栏控制、浏览器cookie控制和浏览器定时调度控制;步骤2:配置搜索模块,所述扩展模块与搜索模块通过Http协议进行通信,所述搜索模块包括搜索服务层与搜索平台,根据扩展模块传过来的目标网页关键词的参数,通过预设的业务检索规则检索,将检索结果回传扩展模块。2.如权利要求1所述的一种网页关键词定位检索方法,其特征在于,所述步骤1中,所述Chrome Extensions的扩展模块基于HTML、JavaScript和CSS,配置的具体步骤如下:步骤1

1:所述清单文件为一个用于描述扩展的所有元数据的JSON格式化的文件,所述扩展所需主机权限通过对主机权限的申请以达到控制扩展浏览器;步骤1

2:所述用户界面包括一个用于预设规则的弹窗的HTML文件,所述预设规则包括用户配置自定义开启监听的目标网页、目标网页关键词定位、目标网页数据动态加载监听和后续自动触发定位检索的规则,所述用户配置自定义开启监听的目标网页记为目标网页URL,所述目标网页关键词定位记为目标网页关键词所在XPath坐标,所述目标网页数据动态加载监听记为目标网页数据动态加载的中间状态XPath坐标,所述后续自动触发定位检索的规则记为目标网页数据动态加载的完毕条件;步骤1

3:所述后台服务为一段JavaScript脚本,读取步骤1

2配置的预设规则并加载至内存中,根据目标网页URL,调用后台服务的浏览器导航栏控制,所述浏览器导航栏控制包括调用Chrome Extensions提供的chrome.webNavigation API中的onCompleted事件,监听浏览器页签是否加载目标网页URL,如是,则触发后续步骤;步骤1

4:调用后台服务的浏览器页签控制控制,所述浏览器页签控制控制包括调用Chrome Extensions提供的chrome.tabs.sendMessage...

【专利技术属性】
技术研发人员:梁宏磊姜平袁志强
申请(专利权)人:焦点科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1