一种基于网页的目标数据搜索方法、模块、浏览器及终端技术

技术编号:13306763 阅读:105 留言:0更新日期:2016-07-10 02:03
本发明专利技术实施例公开了一种基于网页的目标数据搜索方法、模块、浏览器及终端,涉及互联网领域,用以实现对任意网页的实时数据搜索。在本发明专利技术中,在接收到用户通过点击浏览器指定按键所触发的搜索指令后,获取浏览器当前所浏览页面以及从属于该页面的各子级页面的网络地址;根据该页面和所述子级页面的网络地址,获取该页面和所述子级页面所分别包含的文本内容;利用预先设置的关键词,对获取到的文本内容进行匹配,将包含有匹配成功的文本内容的页面和/或子级页面作为目标页面;从而实现了上述功能。

【技术实现步骤摘要】

本专利技术涉及互联网领域,尤其涉及一种基于网页的目标数据搜索方法、模块、浏览器及终端
技术介绍
随着终端设备的广泛应用以及互联网技术的快速发展,越来越多的用户倾向于使用移动终端(如智能手机、平板电脑、移动电脑等)浏览网页。目前,各网站中都包含了各种类型的大量信息,但实际上,用户一般只对部分信息感兴趣,为了能够筛选出用户感兴趣的信息,现有技术通常利用搜索引擎技术搜索目标数据,如常用的Google、Baidu等搜索引擎。目前,各种搜索引擎是利用网络侧服务器搜索用户的搜索习惯、历史纪录等信息,进而在掌握一定用户信息后,根据用户爱好、习惯等,通过网络侧为用户推送一些用户可能感兴趣的目标数据。然而,鉴于网络侧与终端的交互受限于网络速率、服务器处理速率等因素的影响,通过搜索引擎的这种方式通常会存在一定时延,无法为用户提供实时的目标数据推送方案,同时,由于搜索引擎的后台算法的制约,搜索引擎一般还会为用户推荐部分与用户不相关或次相关的广告信息。可见,现有技术中缺少一种能够在任何本文档来自技高网...

【技术保护点】
一种基于网页的目标数据搜索方法,其特征在于,该方法包括:在接收到用户通过点击浏览器指定按键所触发的搜索指令后,获取浏览器当前所浏览页面以及从属于该页面的各子级页面的网络地址;根据该页面和所述子级页面的网络地址,获取该页面和所述子级页面所分别包含的文本内容;利用预先设置的关键词,对获取到的文本内容进行匹配,根据匹配结果,将包含有匹配成功的文本内容的页面和/或子级页面作为目标页面。

【技术特征摘要】
1.一种基于网页的目标数据搜索方法,其特征在于,该方法包括:
在接收到用户通过点击浏览器指定按键所触发的搜索指令后,获取浏览器
当前所浏览页面以及从属于该页面的各子级页面的网络地址;
根据该页面和所述子级页面的网络地址,获取该页面和所述子级页面所分
别包含的文本内容;
利用预先设置的关键词,对获取到的文本内容进行匹配,根据匹配结果,
将包含有匹配成功的文本内容的页面和/或子级页面作为目标页面。
2.如权利要求1所述的方法,其特征在于,所述获取该页面和所述子级
页面所分别包含的文本内容,并对获取到的文本内容进行匹配,具体包括:
根据该页面和所述子级页面的网络地址,获取该页面和所述子级页面所分
别对应的超文本文档对象模型HTMLDOM树,对获取到的各HTMLDOM树
进行遍历操作,在所述遍历操作过程中,利用预先设置的关键词,对各HTML
DOM树中所包含的文本内容进行匹配,根据匹配结果,将包含有匹配成功的
文本内容的HTMLDOM树所对应的页面和/或子级页面作为目标页面。
3.如权利要求2所述的方法,其特征在于,在接收到所述搜索指令之前,
该方法还包括:
获取由用户预先设置的最大遍历深度;
所述对获取到的各HTMLDOM树进行遍历操作,具体包括:
以所述浏览器当前所浏览页面的网络地址为根节点、以从属于该页面的不
同层级的各个子级页面为子节点,由所述根节点开始,依次遍历至层级深度达
到所述最大遍历深度的各子节点。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述利用预先设
置的关键词,对获取到的文本内容进行匹配,具体包括:
获取用户从预先生成的关键词汇分类表中所选择出的关键词或关键词分
类,利用选择出的关键词或者所述关键词分类中所包含的关键词,对获取到的

\t文本内容进行匹配;或者
获取由用户所输入的关键词,利用所述关键词,对...

【专利技术属性】
技术研发人员:朱宏浩
申请(专利权)人:青岛海信移动通信技术股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1