内容数据的生成方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:24456711 阅读:32 留言:0更新日期:2020-06-10 15:45
本申请实施例提供了一种内容数据的生成方法、装置、电子设备及计算机可读介质,涉及互联网技术领域。其中,所述方法包括:接收目标网站根据网页请求返回的网页,其中,网页请求为中间件作为浏览器的代理向目标网站发送的请求;抽取网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将代码块整合到网页的转码页中,转码页包括为转码页的转码内容层配置的内容数据生成层;向浏览器发送转码页,以使浏览器在转码页的内容数据生成层中执行整合到转码页中的代码块,以生成网页的内容数据。通过本申请实施例,能够在浏览器生成原始网页的内容数据,从而避免脱离用户环境生成原始网页的内容数据的情况的发生。

Method, device, electronic equipment and computer readable medium of content data generation

【技术实现步骤摘要】
内容数据的生成方法、装置、电子设备及计算机可读介质
本申请实施例涉及互联网
,尤其涉及一种内容数据的生成方法、装置、电子设备及计算机可读介质。
技术介绍
随着网络的高速发展,人们通过访问网站,可以随时随地获取自己想要的资讯或者服务。在目前的网站建设过程中,大多数的中小型网站都采用模板系统搭建而成,例如,视频网站、小说网站等。由于广告是网站的主要营收手段,因此,采用模板系统所搭建的网站广告多,使网站页面不清爽。为了在保障网站站长的收益的同时,使得用户有更佳的网页浏览体验,需要对网站的原始网页进行转码重建,并在原始网页对应的转码页中受控地投放原始网页的广告。在现有技术中,采用浏览器、中间件及目标网站构成的系统来对网站的原始网页进行转码重建,并在转码页中受控地投放原始网页的广告。具体地,可在中间件解释原始网页之后,选择性地进行广告要素的抽取,并把抽取得到的广告要素整合到转码页中,再把转码页应答给浏览器,使得浏览器展示整合到转码页中的广告要素,从而实现在转码页中受控地投放原始网页的广告。然而,这种做法存在的最大问题是广告的生成并不在浏览器侧,而是在中间件侧。当广告的生成需要依赖用户环境时,中间件侧广告的生成将会脱离用户环境,除非在中间件侧还原出用户环境,但这样的实现成本巨大。
技术实现思路
本申请的目的在于提出一种内容数据的生成方法、装置、电子设备及计算机可读介质,用于解决现有技术中存在的如何在浏览器生成原始网页的内容数据的问题。根据本申请实施例的第一方面,提供了一种内容数据的生成方法。所述方法包括:中间件接收目标网站根据网页请求返回的网页,其中,所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求;所述中间件抽取所述网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将所述代码块整合到所述网页的转码页中,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;所述中间件向所述浏览器发送所述转码页,以使所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的所述代码块,以生成所述网页的内容数据。根据本申请实施例的第二方面,提供了一种内容数据的生成方法。所述方法包括:浏览器接收为所述浏览器代理网页请求的中间件发送的转码页,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的用于生成内容数据的代码块,以生成所述转码页对应的原始网页的内容数据。根据本申请实施例的第三方面,提供了一种内容数据的生成装置。所述装置包括:第一接收模块,用于接收目标网站根据网页请求返回的网页,其中,所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求;第一抽取模块,用于抽取所述网页的代码中用于生成内容数据的代码块;整合模块,用于基于预设的网页模板,将所述代码块整合到所述网页的转码页中,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;发送模块,用于向所述浏览器发送所述转码页,以使所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的所述代码块,以生成所述网页的内容数据。根据本申请实施例的第四方面,提供了一种内容数据的生成装置。所述装置包括:第二接收模块,用于接收为所述浏览器代理网页请求的中间件发送的转码页,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;执行模块,用于在所述转码页的所述内容数据生成层中执行整合到所述转码页中的用于生成内容数据的代码块,以生成所述转码页对应的原始网页的内容数据。根据本申请实施例的第五方面,提供了一种电子设备,包括:一个或多个处理器;计算机可读介质,配置为存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述实施例第一方面或第二方面中所述的内容数据的生成方法。根据本申请实施例的第六方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例第一方面或第二方面中所述的内容数据的生成方法。通过本申请实施例提供的技术方案,中间件接收目标网站根据网页请求返回的网页,并抽取网页的代码中用于生成内容数据的代码块,再基于预设的网页模板,将代码块整合到网页的转码页中,再向浏览器发送转码页,以使浏览器在转码页的内容数据生成层中执行整合到转码页中的代码块,以生成网页的内容数据,与现有的其它方式相比,能够在浏览器生成原始网页的内容数据,从而避免脱离用户环境生成原始网页的内容数据的情况的发生。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本申请实施例一中内容数据的生成方法的步骤流程图;图2为本申请实施例二中内容数据的生成方法的步骤流程图;图3为本申请实施例三中内容数据的生成方法的步骤流程图;图4为本申请实施例四中内容数据的生成装置的结构示意图;图5为本申请实施例五中内容数据的生成装置的结构示意图;图6为本申请实施例六中内容数据的生成装置的结构示意图;图7为本申请实施例七中电子设备的结构示意图;图8为本申请实施例八中电子设备的硬件结构。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅配置为解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。在现有技术中,采用浏览器、中间件及目标网站构成的系统来对网站的原始网页进行转码重建,并在转码页中受控地投放原始网页的广告。但是,这种方案存在的最大问题是广告的生成并不在浏览器侧,而是在中间件侧。当广告的生成需要依赖用户环境时,中间件侧广告的生成将会脱离用户环境,除非在中间件侧还原出用户环境,但这样的实现成本巨大。针对现有技术中存在的如何在浏览器生成原始网页的广告的问题,本申请提出以下解决方案。参照图1,示出了本申请实施例一的内容数据的生成方法的步骤流程图。本实施例从中间件的角度,对本申请实施例提供的内容数据的生成方法进行说明。具体地,本实施例的内容数据的生成方法包括以下步骤:在步骤S101中,中间件接收目标网站根据网页请求返回的网页。在本申请实施例中,所述中间件可理解为一类连接浏览器和网站服务器的计算机软件,提供对网站的原始网页进行转码重建的服务。所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。在一个具体的例子中,响应于用户针对浏览器的搜索结果页中的网页链接的点击操作,所述浏览器向所述中间件发送网页请求,所述中间件的浏览器内核代理所述网页请求,向目标网站请求网页,所述目标网站根据请求返回所请本文档来自技高网...

【技术保护点】
1.一种内容数据的生成方法,其特征在于,所述方法包括:/n中间件接收目标网站根据网页请求返回的网页,其中,所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求;/n所述中间件抽取所述网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将所述代码块整合到所述网页的转码页中,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;/n所述中间件向所述浏览器发送所述转码页,以使所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的所述代码块,以生成所述网页的内容数据。/n

【技术特征摘要】
1.一种内容数据的生成方法,其特征在于,所述方法包括:
中间件接收目标网站根据网页请求返回的网页,其中,所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求;
所述中间件抽取所述网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将所述代码块整合到所述网页的转码页中,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;
所述中间件向所述浏览器发送所述转码页,以使所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的所述代码块,以生成所述网页的内容数据。


2.根据权利要求1所述的方法,其特征在于,所述代码块包括所述网页的代码中用于生成内容数据的脚本标签,
所述中间件抽取所述网页的代码中用于生成内容数据的代码块,包括:
所述中间件抽取所述网页的代码中所有的脚本标签,并对所述脚本标签执行筛选操作,确定所述用于生成内容数据的脚本标签。


3.根据权利要求2所述的方法,其特征在于,所述中间件对所述脚本标签执行筛选操作,确定所述用于生成内容数据的脚本标签,包括:
所述中间件对所述脚本标签进行排列组合,确定不同的脚本标签的组合;
所述中间件针对不同的脚本标签的组合执行筛选操作,确定用于生成内容数据的脚本标签的组合。


4.根据权利要求3所述的方法,其特征在于,所述中间件针对不同的脚本标签的组合执行筛选操作,确定用于生成内容数据的脚本标签的组合,包括:
所述中间件针对每个组合的脚本标签,将脚本标签插入到独立的内联框架标签中执行,以生成相应的内容数据,并确定生成的内容数据的数量;
所述中间件基于每个组合的脚本标签的数量和每个组合的脚本标签生成的内容数据的数量,确定最优的脚本标签的组合;
所述中间件确定所述最优的脚本标签的组合为所述用于生成内容数据的脚本标签的组合。


5.根据权利要求4所述的方法,其特征在于,所述中间件确定生成的内容数据的数量,包括:
所述中间件在将脚本标签插入到独立的内联框架标签中执行之后,遍历所述独立的内联框架标签中的主体节点下的孩子节点,并确定满足设定条件的孩子节点为内容数据节点;
所述中间件基于所述内容数据节点的数量,确定生成的内容数据的数量,
其中,所述设定条件包括以下中的至少一者:所述孩子节点的子孙节点具有显示的图像、所述孩子节点的子孙节点具有的显示的图像的最大宽度等于或大于所述独立的内联框架标签定义的宽度与预设比例的乘积、所述孩子节点的子孙节点具有的显示的图像的最大高度等于或大于预设值。


6.一种内容数据的生成方法,其特征在于,所述方法包括:
浏览器接收为所述浏览器代理网页请求的中间件发送的转码页,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;
所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的用于生成内容数据的代码块,以生成所述转码页对应的原始网页的内容数据。


7.根据权利要求6所述的方法,其特征在于,所述代码块包括所述原始网页的代码中用于生成内容数据的脚本标签,
所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的用于生成内容数据的代码块,以生成所述转码页对应的原始网页的内容数据,包括:
所述浏览器将所述脚本标签插入到所述内容数据生成层对应的内联框架标签中执行;
所述浏览器遍历所述内联框架标签中的主体节点下的孩子节点,并确定满足设定条件的孩子节点为内容数据节点;
所述浏览器基于所述内容数据节点,生成所述转码页对应的原始网页的内容数据,
其中,所述设定条件包括以下中的至少一者:所述设定条件包括以下中的至少一者:所述孩子节点的子孙节点具有显示的图像、所述孩子节点的子孙节点具有的显示的图像的最大宽度等于或大于所述独立的内联框架标签定义的宽度与预设比例的乘积、所述孩子节点的子孙节点具有的显示的图像的最大高度等于或大于预设值。


8.根据权利要求7所述的方法,其特征在于,所述浏览器生成所述转码页对应的原始网页的内容数据之后,所述方法还包括:
所述浏览器在所述转码页的转码内容层中展示所述内容数据。


9.根据权利要求8所述的方法,其特征在于,所述浏览器在所述转码页的转码内容层中展示所述内容数据,包括:
所述浏览器在所述内容数据节点中抽取用于所述内容数据展示的内容体;
所述浏览器基于所述内容数据节点的确定顺序,将所述内容数据节点与所述转码页的转码内容层中的内容数据展示位置关联;
所述浏览器在所述内容数据展示位置展示在与所述内容数据展示位置关联的内容数据节点中抽取的所述内容体。


10.一种内容数据的生成装置,其特征在于,所述装置包括:
第一接收模块,用于接收目标网站根据网页请求返回的网页,...

【专利技术属性】
技术研发人员:陈志鹏
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1