页面解析方法技术

技术编号:39506999 阅读:6 留言:0更新日期:2023-11-25 18:41
本公开的实施例公开了页面解析方法

【技术实现步骤摘要】
页面解析方法、装置、电子设备和计算机可读介质


[0001]本公开的实施例涉及计算机领域,具体涉及页面解析方法

装置

电子设备和计算机可读介质


技术介绍

[0002]在精细化运营的背景下,客服

电销等业务均在数字化转型进程中,提升作业效率是共同的挑战

其中,高效挖掘最佳作业实践具有非常重要的意义

而埋点是数字化分析提效的重要方法之一

目前,进行数据挖掘的方式,通常采用的是:基于统一埋点平台,逐个页面

逐个功能添加埋点,并通过系统上线实现埋点数据采集

[0003]然而,采用上述方式通常会存在以下技术问题:由于页面资源定位标识
URL
的复杂性,同一个页面可能包含不一样的参数

不一样的路由

参数和路由顺序的不同,匹配各种复杂的
URL
,会造成计算量的成倍增加

[0004]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息


技术实现思路

[0005]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述

本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围

[0006]本公开的一些实施例提出了页面解析方法

装置

电子设备

计算机可读介质和程序产品,来解决以上
技术介绍
部分提到的技术问题

[0007]第一方面,本公开的一些实施例提供了一种页面解析方法,该方法包括:生成目标应用对应的站点的站点标识,其中,上述站点关联了上述目标应用包含的各个页面;根据上述站点关联的各个页面,构建页面标识组,其中,各个页面中的页面包含至少一个页面资源定位标识,上述各个页面中的页面对应上述页面标识组中的页面标识;对于上述页面标识组中的每个页面标识,根据上述页面标识与对应的页面资源定位标识,生成页面资源定位标识关系表;根据上述站点标识与各个页面资源定位标识关系表,生成页面解析文件

[0008]可选地,上述方法还包括:将上述页面解析文件接入至上述目标应用对应的内容分发网络服务器中

[0009]可选地,上述根据上述站点关联的各个页面,构建页面标识组,包括:将上述各个页面包含的页面资源定位标识录入至上述站点中;对于上述各个页面中的每个页面,根据上述页面录入至上述站点的各个页面资源定位标识,生成页面标识

[0010]可选地,上述根据上述页面标识与对应的页面资源定位标识,生成页面资源定位标识关系表,包括:确定上述站点中对应上述页面标识的各个页面资源定位标识;对上述各个页面资源定位标识中的每个页面资源定位标识进行哈希处理,以生成哈希页面资源定位标识,得到哈希页面资源定位标识组;对上述页面标识与哈希页面资源定位标识组进行映
射处理,以生成页面资源定位标识关系表

[0011]可选地,上述方法还包括:响应于检测到目标页面的访问操作,根据上述目标页面对应的站点标识,从上述内容分发网络服务器中读取对应的页面解析文件,其中,上述目标页面已接入埋点插件;确定上述访问操作对应的访问页面资源定位标识;确定上述页面解析文件包括的各个页面资源定位标识关系表中是否存在对应上述访问页面资源定位标识的页面资源定位标识关系表;响应于确定存在对应上述访问页面资源定位标识的页面资源定位标识关系表,将上述页面资源定位标识关系表包含的页面标识上传至相关联的页面数据监听系统

[0012]可选地,上述对上述各个页面资源定位标识中的每个页面资源定位标识进行哈希处理,以生成哈希页面资源定位标识,包括:提取上述页面资源定位标识中的页面资源定位路径字符串;根据设定的分割字符组,对上述页面资源定位路径字符串包括的各个字符进行分组处理,以生成页面资源定位路径子字符串序列;对上述页面资源定位路径子字符串序列中的每个页面资源定位路径子字符串进行哈希处理,以生成哈希页面资源定位路径子字符串;将所生成的各个哈希页面资源定位路径子字符串拼接为哈希页面资源定位标识

[0013]第二方面,本公开的一些实施例提供了一种页面解析装置,装置包括:第一生成单元,被配置成生成目标应用对应的站点的站点标识,其中,上述站点关联了上述目标应用包含的各个页面;构建单元,被配置成根据上述站点关联的各个页面,构建页面标识组,其中,各个页面中的页面包含至少一个页面资源定位标识,上述各个页面中的页面对应上述页面标识组中的页面标识;第二生成单元,被配置成对于上述页面标识组中的每个页面标识,根据上述页面标识与对应的页面资源定位标识,生成页面资源定位标识关系表;第三生成单元,被配置成根据上述站点标识与各个页面资源定位标识关系表,生成页面解析文件

[0014]可选地,页面解析装置,还包括:接入单元,被配置成将上述页面解析文件接入至上述目标应用对应的内容分发网络服务器中

[0015]可选地,构建单元,被进一步配置成:将上述各个页面包含的页面资源定位标识录入至上述站点中;对于上述各个页面中的每个页面,根据上述页面录入至上述站点的各个页面资源定位标识,生成页面标识

[0016]可选地,第二生成单元,被进一步配置成:确定上述站点中对应上述页面标识的各个页面资源定位标识;对上述各个页面资源定位标识中的每个页面资源定位标识进行哈希处理,以生成哈希页面资源定位标识,得到哈希页面资源定位标识组;对上述页面标识与哈希页面资源定位标识组进行映射处理,以生成页面资源定位标识关系表

[0017]可选地,第二生成单元,被进一步配置成:提取上述页面资源定位标识中的页面资源定位路径字符串;根据设定的分割字符组,对上述页面资源定位路径字符串包括的各个字符进行分组处理,以生成页面资源定位路径子字符串序列;对上述页面资源定位路径子字符串序列中的每个页面资源定位路径子字符串进行哈希处理,以生成哈希页面资源定位路径子字符串;将所生成的各个哈希页面资源定位路径子字符串拼接为哈希页面资源定位标识

[0018]可选地,页面解析装置,还包括:读取单元,被配置成响应于检测到目标页面的访问操作,根据上述目标页面对应的站点标识,从上述内容分发网络服务器中读取对应的页面解析文件,其中,上述目标页面已接入埋点插件;第一确定单元,被配置成确定上述访问
操作对应的访问页面资源定位标识;第二确定单元,被配置成确定上述页面解析文件包括的各个页面资源定位标识关系表中是否存在对应上述访问页面资源定位标识的页面资源定位标识关系表;上传单元,被配置成响应于确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种页面解析方法,包括:生成目标应用对应的站点的站点标识,其中,所述站点关联了所述目标应用包含的各个页面;根据所述站点关联的各个页面,构建页面标识组,其中,各个页面中的页面包含至少一个页面资源定位标识,所述各个页面中的页面对应所述页面标识组中的页面标识;对于所述页面标识组中的每个页面标识,根据所述页面标识与对应的页面资源定位标识,生成页面资源定位标识关系表;根据所述站点标识与各个页面资源定位标识关系表,生成页面解析文件
。2.
根据权利要求1所述的方法,其中,所述方法还包括:将所述页面解析文件接入至所述目标应用对应的内容分发网络服务器中
。3.
根据权利要求1所述的方法,其中,所述根据所述站点关联的各个页面,构建页面标识组,包括:将所述各个页面包含的页面资源定位标识录入至所述站点中;对于所述各个页面中的每个页面,根据所述页面录入至所述站点的各个页面资源定位标识,生成页面标识
。4.
根据权利要求2所述的方法,其中,所述根据所述页面标识与对应的页面资源定位标识,生成页面资源定位标识关系表,包括:确定所述站点中对应所述页面标识的各个页面资源定位标识;对所述各个页面资源定位标识中的每个页面资源定位标识进行哈希处理,以生成哈希页面资源定位标识,得到哈希页面资源定位标识组;对所述页面标识与哈希页面资源定位标识组进行映射处理,以生成页面资源定位标识关系表
。5.
根据权利要求2所述的方法,其中,所述方法还包括:响应于检测到目标页面的访问操作,根据所述目标页面对应的站点标识,从所述内容分发网络服务器中读取对应的页面解析文件,其中,所述目标页面已接入埋点插件;确定所述访问操作对应的访问页面资源定位标识;确定所述页面解析文件包括的各个页面资源定位标识关系表中是否存在对应所述访问页面资源定位标识的页面资源定位标识关系表;响应于确定存在对应所述访问页面资源定位标识的页面资源...

【专利技术属性】
技术研发人员:张同宇王彦军东旭辉金建华李丹枫王宇光吕军
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1