【技术实现步骤摘要】
内容数据的生成方法、装置、电子设备及计算机可读介质
本申请实施例涉及互联网
,尤其涉及一种内容数据的生成方法、装置、电子设备及计算机可读介质。
技术介绍
随着网络的高速发展,人们通过访问网站,可以随时随地获取自己想要的资讯或者服务。在目前的网站建设过程中,大多数的中小型网站都采用模板系统搭建而成,例如,视频网站、小说网站等。由于广告是网站的主要营收手段,因此,采用模板系统所搭建的网站广告多,使网站页面不清爽。为了在保障网站站长的收益的同时,使得用户有更佳的网页浏览体验,需要对网站的原始网页进行转码重建,并在原始网页对应的转码页中受控地投放原始网页的广告。在现有技术中,采用浏览器、中间件及目标网站构成的系统来对网站的原始网页进行转码重建,并在转码页中受控地投放原始网页的广告。具体地,可在中间件解释原始网页之后,选择性地进行广告要素的抽取,并把抽取得到的广告要素整合到转码页中,再把转码页应答给浏览器,使得浏览器展示整合到转码页中的广告要素,从而实现在转码页中受控地投放原始网页的广告。然而,这种做法存在的最大问题是广告的生成并不在浏览器侧,而是在中间件侧。当广告的生成需要依赖用户环境时,中间件侧广告的生成将会脱离用户环境,除非在中间件侧还原出用户环境,但这样的实现成本巨大。
技术实现思路
本申请的目的在于提出一种内容数据的生成方法、装置、电子设备及计算机可读介质,用于解决现有技术中存在的如何在浏览器生成原始网页的内容数据的问题。根据本申请实施例的第一方面,提供了一种内容数据的生成方 ...
【技术保护点】
1.一种内容数据的生成方法,其特征在于,所述方法包括:/n中间件接收目标网站根据网页请求返回的网页,其中,所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求;/n所述中间件抽取所述网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将所述代码块整合到所述网页的转码页中,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;/n所述中间件向所述浏览器发送所述转码页,以使所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的所述代码块,以生成所述网页的内容数据。/n
【技术特征摘要】
1.一种内容数据的生成方法,其特征在于,所述方法包括:
中间件接收目标网站根据网页请求返回的网页,其中,所述网页请求为所述中间件作为浏览器的代理向所述目标网站发送的请求;
所述中间件抽取所述网页的代码中用于生成内容数据的代码块,并基于预设的网页模板,将所述代码块整合到所述网页的转码页中,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;
所述中间件向所述浏览器发送所述转码页,以使所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的所述代码块,以生成所述网页的内容数据。
2.根据权利要求1所述的方法,其特征在于,所述代码块包括所述网页的代码中用于生成内容数据的脚本标签,
所述中间件抽取所述网页的代码中用于生成内容数据的代码块,包括:
所述中间件抽取所述网页的代码中所有的脚本标签,并对所述脚本标签执行筛选操作,确定所述用于生成内容数据的脚本标签。
3.根据权利要求2所述的方法,其特征在于,所述中间件对所述脚本标签执行筛选操作,确定所述用于生成内容数据的脚本标签,包括:
所述中间件对所述脚本标签进行排列组合,确定不同的脚本标签的组合;
所述中间件针对不同的脚本标签的组合执行筛选操作,确定用于生成内容数据的脚本标签的组合。
4.根据权利要求3所述的方法,其特征在于,所述中间件针对不同的脚本标签的组合执行筛选操作,确定用于生成内容数据的脚本标签的组合,包括:
所述中间件针对每个组合的脚本标签,将脚本标签插入到独立的内联框架标签中执行,以生成相应的内容数据,并确定生成的内容数据的数量;
所述中间件基于每个组合的脚本标签的数量和每个组合的脚本标签生成的内容数据的数量,确定最优的脚本标签的组合;
所述中间件确定所述最优的脚本标签的组合为所述用于生成内容数据的脚本标签的组合。
5.根据权利要求4所述的方法,其特征在于,所述中间件确定生成的内容数据的数量,包括:
所述中间件在将脚本标签插入到独立的内联框架标签中执行之后,遍历所述独立的内联框架标签中的主体节点下的孩子节点,并确定满足设定条件的孩子节点为内容数据节点;
所述中间件基于所述内容数据节点的数量,确定生成的内容数据的数量,
其中,所述设定条件包括以下中的至少一者:所述孩子节点的子孙节点具有显示的图像、所述孩子节点的子孙节点具有的显示的图像的最大宽度等于或大于所述独立的内联框架标签定义的宽度与预设比例的乘积、所述孩子节点的子孙节点具有的显示的图像的最大高度等于或大于预设值。
6.一种内容数据的生成方法,其特征在于,所述方法包括:
浏览器接收为所述浏览器代理网页请求的中间件发送的转码页,所述转码页包括为所述转码页的转码内容层配置的内容数据生成层;
所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的用于生成内容数据的代码块,以生成所述转码页对应的原始网页的内容数据。
7.根据权利要求6所述的方法,其特征在于,所述代码块包括所述原始网页的代码中用于生成内容数据的脚本标签,
所述浏览器在所述转码页的所述内容数据生成层中执行整合到所述转码页中的用于生成内容数据的代码块,以生成所述转码页对应的原始网页的内容数据,包括:
所述浏览器将所述脚本标签插入到所述内容数据生成层对应的内联框架标签中执行;
所述浏览器遍历所述内联框架标签中的主体节点下的孩子节点,并确定满足设定条件的孩子节点为内容数据节点;
所述浏览器基于所述内容数据节点,生成所述转码页对应的原始网页的内容数据,
其中,所述设定条件包括以下中的至少一者:所述设定条件包括以下中的至少一者:所述孩子节点的子孙节点具有显示的图像、所述孩子节点的子孙节点具有的显示的图像的最大宽度等于或大于所述独立的内联框架标签定义的宽度与预设比例的乘积、所述孩子节点的子孙节点具有的显示的图像的最大高度等于或大于预设值。
8.根据权利要求7所述的方法,其特征在于,所述浏览器生成所述转码页对应的原始网页的内容数据之后,所述方法还包括:
所述浏览器在所述转码页的转码内容层中展示所述内容数据。
9.根据权利要求8所述的方法,其特征在于,所述浏览器在所述转码页的转码内容层中展示所述内容数据,包括:
所述浏览器在所述内容数据节点中抽取用于所述内容数据展示的内容体;
所述浏览器基于所述内容数据节点的确定顺序,将所述内容数据节点与所述转码页的转码内容层中的内容数据展示位置关联;
所述浏览器在所述内容数据展示位置展示在与所述内容数据展示位置关联的内容数据节点中抽取的所述内容体。
10.一种内容数据的生成装置,其特征在于,所述装置包括:
第一接收模块,用于接收目标网站根据网页请求返回的网页,...
【专利技术属性】
技术研发人员:陈志鹏,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。