内容数据的生成方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:24456711 阅读:34 留言:0更新日期:2020-06-10 15:45
本申请实施例提供了一种内容数据的生成方法、装置、电子设备及计算机可读介质,涉及互联网技术领域。其中,所述方法包括:接收目标网站根据网页请求返回的网页,其中,网页请求为中间件作为浏览器的代理向目标网站发送的请求;抽取网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将代码块整合到网页的转码页中,转码页包括为转码页的转码内容层配置的内容数据生成层;向浏览器发送转码页,以使浏览器在转码页的内容数据生成层中执行整合到转码页中的代码块,以生成网页的内容数据。通过本申请实施例,能够在浏览器生成原始网页的内容数据,从而避免脱离用户环境生成原始网页的内容数据的情况的发生。

Method, device, electronic equipment and computer readable medium of content data generation

【技术实现步骤摘要】
内容数据的生成方法、装置、电子设备及计算机可读介质
本申请实施例涉及互联网
,尤其涉及一种内容数据的生成方法、装置、电子设备及计算机可读介质。
技术介绍
随着网络的高速发展,人们通过访问网站,可以随时随地获取自己想要的资讯或者服务。在目前的网站建设过程中,大多数的中小型网站都采用模板系统搭建而成,例如,视频网站、小说网站等。由于广告是网站的主要营收手段,因此,采用模板系统所搭建的网站广告多,使网站页面不清爽。为了在保障网站站长的收益的同时,使得用户有更佳的网页浏览体验,需要对网站的原始网页进行转码重建,并在原始网页对应的转码页中受控地投放原始网页的广告。在现有技术中,采用浏览器、中间件及目标网站构成的系统来对网站的原始网页进行转码重建,并在转码页中受控地投放原始网页的广告。具体地,可在中间件解释原始网页之后,选择性地进行广告要素的抽取,并把抽取得到的广告要素整合到转码页中,再把转码页应答给浏览器,使得浏览器展示整合到转码页中的广告要素,从而实现在转码页中受控地投放原始网页的广告。然而,这种做法存在的最大问题是广告的生成并不在浏览器本文档来自技高网...

【技术保护点】
1.一种内容数据的生成方法,其特征在于,所述方法包括:/n中间件接收目标网站根据网页请求返回的网页,其中,所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求;/n所述中间件抽取所述网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将所述代码块整合到所述网页的转码页中,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;/n所述中间件向所述浏览器发送所述转码页,以使所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的所述代码块,以生成所述网页的内容数据。/n

【技术特征摘要】
1.一种内容数据的生成方法,其特征在于,所述方法包括:
中间件接收目标网站根据网页请求返回的网页,其中,所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求;
所述中间件抽取所述网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将所述代码块整合到所述网页的转码页中,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;
所述中间件向所述浏览器发送所述转码页,以使所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的所述代码块,以生成所述网页的内容数据。


2.根据权利要求1所述的方法,其特征在于,所述代码块包括所述网页的代码中用于生成内容数据的脚本标签,
所述中间件抽取所述网页的代码中用于生成内容数据的代码块,包括:
所述中间件抽取所述网页的代码中所有的脚本标签,并对所述脚本标签执行筛选操作,确定所述用于生成内容数据的脚本标签。


3.根据权利要求2所述的方法,其特征在于,所述中间件对所述脚本标签执行筛选操作,确定所述用于生成内容数据的脚本标签,包括:
所述中间件对所述脚本标签进行排列组合,确定不同的脚本标签的组合;
所述中间件针对不同的脚本标签的组合执行筛选操作,确定用于生成内容数据的脚本标签的组合。


4.根据权利要求3所述的方法,其特征在于,所述中间件针对不同的脚本标签的组合执行筛选操作,确定用于生成内容数据的脚本标签的组合,包括:
所述中间件针对每个组合的脚本标签,将脚本标签插入到独立的内联框架标签中执行,以生成相应的内容数据,并确定生成的内容数据的数量;
所述中间件基于每个组合的脚本标签的数量和每个组合的脚本标签生成的内容数据的数量,确定最优的脚本标签的组合;
所述中间件确定所述最优的脚本标签的组合为所述用于生成内容数据的脚本标签的组合。


5.根据权利要求4所述的方法,其特征在于,所述中间件确定生成的内容数据的数量,包括:
所述中间件在将脚本标签插入到独立的内联框架标签中执行之后,遍历所述独立的内联框架标签中的主体节点下的孩子节点,并确定满足设定条件的孩子节点为内容数据节点;
所述中间件基于所述内容数据节点的数量,确定生成的内容数据的数量,
其中,所述设定条件包括以下中的至少一者:所述孩子节点的子孙节点具有显示的图像、所述孩子节点的子孙节点具有的显示的图像的最大宽度等于或大于所述独立的内联框架标签定义的宽度与预设比例的乘积、所述孩子节点的子孙节点具有的显示的图像的最大高度等于或大于预设值。


6.一种内容数据的生成方法,其特征在于,所述方法包括:
浏览器接收为所述浏览器代理网页请求的中间件发送的转码页,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;
所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的用于生成内容数据的代码块,以生成所述转码页对应的原始网页的内容数据。


7.根据权利要求6所述的方法,其特征在于,所述代码块包括所述原始网页的代码中用于生成内容数据的脚本标签,
所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的用于生成内容数据的代码块,以生成所述转码页对应的原始网页的内容数据,包括:
所述浏览器将所述脚本标签插入到所述内容数据生成层对应的内联框架标签中执行;
所述浏览器遍历所述内联框架标签中的主体节点下的孩子节点,并确定满足设定条件的孩子节点为内容数据节点;
所述浏览器基于所述内容数据节点,生成所述转码页对应的原始网页的内容数据,
其中,所述设定条件包括以下中的至少一者:所述设定条件包括以下中的至少一者:所述孩子节点的子孙节点具有显示的图像、所述孩子节点的子孙节点具有的显示的图像的最大宽度等于或大于所述独立的内联框架标签定义的宽度与预设比例的乘积、所述孩子节点的子孙节点具有的显示的图像的最大高度等于或大于预设值。


8.根据权利要求7所述的方法,其特征在于,所述浏览器生成所述转码页对应的原始网页的内容数据之后,所述方法还包括:
所述浏览器在所述转码页的转码内容层中展示所述内容数据。


9.根据权利要求8所述的方法,其特征在于,所述浏览器在所述转码页的转码内容层中展示所述内容数据,包括:
所述浏览器在所述内容数据节点中抽取用于所述内容数据展示的内容体;
所述浏览器基于所述内容数据节点的确定顺序,将所述内容数据节点与所述转码页的转码内容层中的内容数据展示位置关联;
所述浏览器在所述内容数据展示位置展示在与所述内容数据展示位置关联的内容数据节点中抽取的所述内容体。


10.一种内容数据的生成装置,其特征在于,所述装置包括:
第一接收模块,用于接收目标网站根据网页请求返回的网页,...

【专利技术属性】
技术研发人员:陈志鹏
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1