页面合成方法及装置制造方法及图纸

技术编号:31077847 阅读:24 留言:0更新日期:2021-12-01 11:29
本发明专利技术公开了一种页面合成方法及装置。其中,该方法包括:获取访问网页页面时针对页面元素产生的URI请求报文;根据URI请求报文,生成包含预设页面合成字段的页面合成数据组;利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素;对属于同一用户在同一时间访问的同一页面的页面元素进行页面合成,得到合成页面。基于本发明专利技术提供的方案,基于页面元素级的用户上网日志进行页面合成,得到网页页面级的用户上网日志,为后期获取网页页面级的用户上网质量指标提供基础,可支撑更真实有效的评估用户浏览网页真实感受的分析。的分析。的分析。

【技术实现步骤摘要】
页面合成方法及装置


[0001]本专利技术涉及互联网
,具体涉及一种页面合成方法及装置。

技术介绍

[0002]近几年,随着科学技术的进步,现网的流量不断扩增。在各业务流量的占比中,浏览类业务流量占比一直居于首位,同时,在当下快节奏的生活中,网页浏览者对页面浏览类业务网络质量的要求也更高。目前关于浏览类业务的网络质量检测手段主要有两种:一种是基于拨测手段模拟用户上网行为,另一种是基于DPI探针检测技术获取用户访问记录。
[0003]基于拨测手段模拟用户上网行为统计浏览类业务网络质量的方式,不能全面反映用户真实的上网访问质量情况;基于DPI探针检测技术获取用户访问记录统计浏览类业务网络质量的方式,是基于元素的URI、Host、ICP等级别进行汇总归纳所得到的质量指标,其与页面本身的质量指标还是存在差异的。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的页面合成方法及装置。
[0005]根据本专利技术实施例的一个方面,提供了一种页面合成方法,包括:
[0006]获取访问网页页面时针对页面元素产生的URI请求报文;
[0007]根据URI请求报文,生成包含预设页面合成字段的页面合成数据组;
[0008]利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素;
[0009]对属于同一用户在同一时间访问的同一页面的页面元素进行页面合成,得到合成页面。
[0010]根据本专利技术实施例的另一方面,提供了一种页面合成装置,包括:
[0011]获取模块,适于获取访问网页页面时针对页面元素产生的URI请求报文;
[0012]生成模块,适于根据URI请求报文,生成包含预设页面合成字段的页面合成数据组;
[0013]聚类模块,适于利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素;
[0014]页面合成模块,适于对属于同一用户在同一时间访问的同一页面的页面元素进行页面合成,得到合成页面。
[0015]根据本专利技术实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
[0016]存储器用于存放至少一可执行指令,可执行指令使处理器执行上述页面合成方法对应的操作。
[0017]根据本专利技术实施例的再一方面,提供了一种计算机存储介质,存储介质中存储有
至少一可执行指令,可执行指令使处理器执行如上述页面合成方法对应的操作。
[0018]根据本专利技术上述实施例提供的方案,获取访问网页页面时针对页面元素产生的URI请求报文;根据URI请求报文,生成包含预设页面合成字段的页面合成数据组;利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素;对属于同一用户在同一时间访问的同一页面的页面元素进行页面合成,得到合成页面。基于本专利技术提供的方案,基于页面元素级的用户上网日志进行页面合成,得到网页页面级的用户上网日志,为后期获取网页页面级的用户上网质量指标提供基础,可支撑更真实有效的评估用户浏览网页真实感受的分析。
[0019]上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术实施例的具体实施方式。
附图说明
[0020]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0021]图1示出了本专利技术实施例提供的页面合成方法流程图;
[0022]图2示出了本专利技术另一实施例提供的页面合成方法的流程图;
[0023]图3示出了本专利技术实施例提供的页面合成装置的结构示意图;
[0024]图4示出了本专利技术实施例提供的计算设备的结构示意图。
具体实施方式
[0025]下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。
[0026]图1示出了本专利技术实施例提供的页面合成方法的流程图。如图1所示,该方法包括以下步骤:
[0027]步骤S101,获取访问网页页面时针对页面元素产生的URI请求报文。
[0028]大多数情况下,网页页面是由多个不同的页面元素组成的,任一用户对任一网页页面进行访问时,会触发对多个页面元素的访问请求,而针对任一页面元素的访问请求都会产生一条URI请求报文。其中,页面元素可以是PNG,JPG,Video,HTML,JS,CSS等,URI请求报文中可以包含很多信息,例如,业务标签、流开始时间、用户IP地址、用户终端信息、用户访问的资源URI、用户访问的资源域名、资源的上一级来源地址refer_uri、上下行流量、时延等信息。
[0029]步骤S102,根据URI请求报文,生成包含预设页面合成字段的页面合成数据组。
[0030]步骤S101所获取到的URI请求报文中包含了很多信息,有些信息对于判断页面元素是否为同一用户在同一时间访问的同一页面的页面元素并没有太多的帮助,反而会影响判断或者增加计算资源,因此,在获取到URI请求报文,可以根据URI请求报文,生成包含预
设页面合成字段的页面合成数据组,其中,预设页面合成字段包含:用户终端信息、用户IP地址、来源地址、流开始时间。所生成的页面合成数据组是从URI请求报文中提取出了预设页面合成字段对应的信息,页面合成数据组所包含的信息明显少于URI请求报文。
[0031]步骤S103,利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素。
[0032]步骤S102所生成的包含预设页面合成字段的页面合成数据组覆盖了很多用户对很多页面中的页面元素,而在进行页面合成时,是利用同一用户在同一时间访问的同一页面的页面元素进行合成,因此,就需要对众多的页面元素进行划分,就涉及到页面元素聚类处理,具体地,可以利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,通过页面元素聚类处理能够确定属于同一用户在同一时间访问的同一页面的页面元素,实现了对众多页面元素的聚类划分。
[0033]步骤S104,对属于同一用户在同一时间访问的同一页面的页面元素进行页面合成,得到合成页面。
[0034]在根据步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种页面合成方法,包括:获取访问网页页面时针对页面元素产生的URI请求报文;根据所述URI请求报文,生成包含预设页面合成字段的页面合成数据组;利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素;对属于同一用户在同一时间访问的同一页面的页面元素进行页面合成,得到合成页面。2.根据权利要求1所述的方法,其中,所述预设页面合成字段包含:用户终端信息、用户IP地址、来源地址、流开始时间。3.根据权利要求2所述的方法,其中,所述利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素进一步包括:根据用户终端信息、用户IP地址及来源地址计算任意两个页面合成数据组之间的欧氏距离,若欧氏距离等于第一预设阈值,则将相应的页面合成数据组划分为同一类;针对划分为同一类的页面合成数据组,根据用户终端信息、用户IP地址、来源地址、流开始时间计算最小流开始时间对应的页面合成数据组与最大流开始时间对应的页面合成数据组之间的欧氏距离,若欧氏距离小于或等于第二预设阈值,则将相应的页面合成数据组对应的页面元素确定为属于同一用户在同一时间访问的同一页面的页面元素。4.根据权利要求3所述的方法,其中,在若欧氏距离等于第一预设阈值,则将相应的页面合成数据组划分为同一类之后,所述方法还包括:针对划分为同一类的页面合成数据组,根据流开始时间对同一类的页面合成数据组进行排序处理。5.根据权利要求2-4中任一项所述的方法,其中,在利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理之前,所述方法还包括:根据来源地址对页面合成数据组进行有效性过滤,得到有效...

【专利技术属性】
技术研发人员:郑辉唐蓉
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1