网页内容展示方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:30829533 阅读:11 留言:0更新日期:2021-11-18 12:38
本公开提供了网页内容展示方法、装置、电子设备以及存储介质,涉及计算机技术领域,尤其涉及信息流领域。具体实现方案为:响应于针对第一链接对象的第一访问操作,确定与第一链接对象相对应的第一网页内容;利用劫持例程调用与第一链接对象所属的第一网站相对应的网站节点查询规则,其中,网站节点查询规则包括根据第一网站中预定网页元素的文档对象模型确定的规则;根据网站节点查询规则,从第一网页内容中确定与预定网页元素相对应的第二网页内容;以及基于第二网站对第二网页内容进行展示。展示。展示。

【技术实现步骤摘要】
网页内容展示方法、装置、电子设备以及存储介质


[0001]本公开涉及计算机
,尤其涉及信息流领域。

技术介绍

[0002]随着社会的信息化和信息大量涌现,以及人们对信息要求的激增,信息流形成了错综复杂、瞬息万变的形态。在社会经济生活中,随着互联网技术的广泛发展,信息流的作用越来越重要,例如体现在浏览器中网页内容的展示等方面。

技术实现思路

[0003]本公开提供了一种网页内容展示方法、装置、电子设备以及存储介质。
[0004]根据本公开的一方面,提供了一种网页内容展示方法,包括:响应于针对第一链接对象的第一访问操作,确定与所述第一链接对象相对应的第一网页内容;调用与所述第一链接对象所属的第一网站相对应的网站节点查询规则,其中,所述网站节点查询规则包括根据所述第一网站中预定网页元素的文档对象模型确定的规则;根据所述网站节点查询规则,从所述第一网页内容中确定与所述预定网页元素相对应的第二网页内容;以及基于第二网站对所述第二网页内容进行展示。
[0005]根据本公开的另一方面,提供了一种网页内容展示装置,包括:第一确定模块,用于响应于针对第一链接对象的第一访问操作,确定与所述第一链接对象相对应的第一网页内容;调用模块,用于调用与所述第一链接对象所属的第一网站相对应的网站节点查询规则,其中,所述网站节点查询规则包括根据所述第一网站中预定网页元素的文档对象模型确定的规则;第二确定模块,用于根据所述网站节点查询规则,从所述第一网页内容中确定与所述预定网页元素相对应的第二网页内容;以及第一展示模块,用于基于第二网站对所述第二网页内容进行展示。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的网页内容展示方法。
[0007]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的网页内容展示方法。
[0008]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的网页内容展示方法。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1示意性示出了根据本公开实施例的可以应用网页内容展示方法及装置的示例性系统架构;
[0012]图2示意性示出了根据本公开实施例的网页内容展示方法的流程图;
[0013]图3示意性示出了根据本公开一个实施例的实现网页内容展示的示意图;
[0014]图4示意性示出了根据本公开另一个实施例的实现网页内容展示的示意图;
[0015]图5示意性示出了根据本公开实施例的阅读器展示网页内容以及爬取数据源的流程图;
[0016]图6A示意性示出了根据本公开一个实施例的基于虚拟目录加载章节内容的示意图;
[0017]图6B示意性示出了根据本公开另一个实施例的基于虚拟目录加载章节内容的示意图;
[0018]图7示意性示出了根据本公开实施例的实现网页内容展示方法的系统架构图;
[0019]图8示意性示出了根据本公开实施例的网页内容展示装置的框图;以及
[0020]图9示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]在本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
[0023]在搜索引擎搜索三方站点时,搜索结果页的自然结果,在浏览过程中经常会弹出浮层广告,广告内容以色情擦边为主,影响用户正常浏览体验。且不同站点中网页功能通常不同,导致用户浏览体验差别大。
[0024]针对浮层广告这一问题,在获取三方站点的网页内容时通常采用如下手段:交在要访问的网页中的所有HTML(超文本标记语言)文档,通过解析HTML文档的标签,来获取到该网页的内容部分。利用正则表达式删除残留的HTML标签,只保留内容部分。采用txt(textfile,文本文件)阅读器打开提取出来的内容。
[0025]专利技术人在实现本公开构思的过程中发现,利用正则表达式确定网页内容的方法,会有一些额外的无用数据无法过滤掉,网页内容显示效果不好。
[0026]图1示意性示出了根据本公开实施例的可以应用网页内容展示方法及装置的示例性系统架构。
[0027]需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用内容处理方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的网页内容展示方法及装置。
[0028]如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络
104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
[0029]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
[0030]终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0031]服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(

Virtual Pri本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网页内容展示方法,包括:响应于针对第一链接对象的第一访问操作,确定与所述第一链接对象相对应的第一网页内容;调用与所述第一链接对象所属的第一网站相对应的网站节点查询规则,其中,所述网站节点查询规则包括根据所述第一网站中预定网页元素的文档对象模型确定的规则;根据所述网站节点查询规则,从所述第一网页内容中确定与所述预定网页元素相对应的第二网页内容;以及基于第二网站对所述第二网页内容进行展示。2.根据权利要求1所述的方法,其中,基于第二网站对所述第二网页内容进行展示包括:调用页面生成组件,其中,所述页面生成组件为与所述第二网站相关的组件;通过所述页面生成组件,将所述第二网页内容渲染为第一目标网页;以及基于第二网站对所述第一目标网页进行展示。3.根据权利要求2所述的方法,其中,所述第二网页内容包括第二链接对象;所述方法还包括:响应于针对所述第二链接对象的第二访问操作,确定与所述第二链接对象相对应的第三网页内容,其中,所述第三网页内容包括存储于所述第一网站中的内容;根据所述网站节点查询规则,从所述第三网页内容中确定与所述预定网页元素相对应的第四网页内容;以及基于所述第二网站对所述第四网页内容进行展示。4.根据权利要求3所述的方法,其中,响应于针对所述第二链接对象的第二访问操作,确定与所述第二链接对象相对应的第三网页内容包括:确定与所述第二链接对象相对应的链接地址;以及通过数据提供组件确定与所述链接地址相对应的第三网页内容,其中,所述数据提供组件为与所述第二网站相关的组件。5.根据权利要求4所述的方法,其中,通过数据提供组件确定与所述链接地址相对应的第三网页内容包括:通过所述第二网站,从所述第一网站中加载与所述链接地址相对应的超文本标记语言内容;以及将所述超文本标记语言内容作为所述第三网页内容。6.根据权利要求4或5所述的方法,还包括:确定与所述第二访问操作相对应的标识信息;以及将与所述标识信息相对应的网页内容作为所述第三网页内容。7.根据权利要求1至6中任一所述的方法,其中,所述第一访问操作包括对文章中目标章节内容的选择操作,所述第二网页内容包括所述目标章节内容;所述方法还包括:确定与所述目标章节内容相对应的章节在所述文章中所有章节中的第一排序编号;以及将所述目标章节内容存储至虚拟空间中的目标存储空间,其中,所述虚拟空间为预设的用于分章节存储所述文章中的各章节内容的存储空间,所述目标存储空间在所述虚拟空
间中的第二排序编号与所述第一排序编号相同。8.根据权利要求1至7中任一所述的方法,其中,所述第二网页内容包括文章的目录;所述方法还包括:确定所述文章的目录的目录样式;在所述目录样式为列表样式的情况下,通过获取目录例程加载与所述文章相对应的所有目录,或者通过所述获取目录例程加载与所述文章相对应的存储于同一个页面中的所有目录;以及在所述目录样式为分组样式的情况下,通过获取分组目录例程加载所述文章的所有分组目录,或者通过所述获取分组目录例程加载与预定章节内容所对应的目标目录相对应的目标分组目录。9.根据权利要求1所述的方法,还包括:获取网站白名单列表;以及根据所述网站白名单列表确定所述目标网站。10.一种网页内容展示装置,包括:第一确定模块,用于响应于针对第一链接对象的第一访问操作,确定与所述第一链接对象相对应的第一网页内容;调用模块,用于调用与所述第一链接对象所属的第一网站相对应的网站节点查询规则,其中,所述网站节点查询规则包括根据所述第一网站中预定网页元素的文档对象模型确定的规则;第二确定模块,用于根据所述网站节点查询规则,从所述第一网页内容中确定与所...

【专利技术属性】
技术研发人员:王子雄
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1