页面合成方法及装置制造方法及图纸

技术编号:31077847 阅读:25 留言:0更新日期:2021-12-01 11:29
本发明专利技术公开了一种页面合成方法及装置。其中,该方法包括:获取访问网页页面时针对页面元素产生的URI请求报文;根据URI请求报文,生成包含预设页面合成字段的页面合成数据组;利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素;对属于同一用户在同一时间访问的同一页面的页面元素进行页面合成,得到合成页面。基于本发明专利技术提供的方案,基于页面元素级的用户上网日志进行页面合成,得到网页页面级的用户上网日志,为后期获取网页页面级的用户上网质量指标提供基础,可支撑更真实有效的评估用户浏览网页真实感受的分析。的分析。的分析。

【技术实现步骤摘要】
页面合成方法及装置


[0001]本专利技术涉及互联网
,具体涉及一种页面合成方法及装置。

技术介绍

[0002]近几年,随着科学技术的进步,现网的流量不断扩增。在各业务流量的占比中,浏览类业务流量占比一直居于首位,同时,在当下快节奏的生活中,网页浏览者对页面浏览类业务网络质量的要求也更高。目前关于浏览类业务的网络质量检测手段主要有两种:一种是基于拨测手段模拟用户上网行为,另一种是基于DPI探针检测技术获取用户访问记录。
[0003]基于拨测手段模拟用户上网行为统计浏览类业务网络质量的方式,不能全面反映用户真实的上网访问质量情况;基于DPI探针检测技术获取用户访问记录统计浏览类业务网络质量的方式,是基于元素的URI、Host、ICP等级别进行汇总归纳所得到的质量指标,其与页面本身的质量指标还是存在差异的。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的页面合成方法及装置。
[0005]根据本专利技术实施例的一个方面,提供了一种页面合成方法,包本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种页面合成方法,包括:获取访问网页页面时针对页面元素产生的URI请求报文;根据所述URI请求报文,生成包含预设页面合成字段的页面合成数据组;利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素;对属于同一用户在同一时间访问的同一页面的页面元素进行页面合成,得到合成页面。2.根据权利要求1所述的方法,其中,所述预设页面合成字段包含:用户终端信息、用户IP地址、来源地址、流开始时间。3.根据权利要求2所述的方法,其中,所述利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理,确定属于同一用户在同一时间访问的同一页面的页面元素进一步包括:根据用户终端信息、用户IP地址及来源地址计算任意两个页面合成数据组之间的欧氏距离,若欧氏距离等于第一预设阈值,则将相应的页面合成数据组划分为同一类;针对划分为同一类的页面合成数据组,根据用户终端信息、用户IP地址、来源地址、流开始时间计算最小流开始时间对应的页面合成数据组与最大流开始时间对应的页面合成数据组之间的欧氏距离,若欧氏距离小于或等于第二预设阈值,则将相应的页面合成数据组对应的页面元素确定为属于同一用户在同一时间访问的同一页面的页面元素。4.根据权利要求3所述的方法,其中,在若欧氏距离等于第一预设阈值,则将相应的页面合成数据组划分为同一类之后,所述方法还包括:针对划分为同一类的页面合成数据组,根据流开始时间对同一类的页面合成数据组进行排序处理。5.根据权利要求2-4中任一项所述的方法,其中,在利用预设页面合成聚类算法对页面合成数据组进行页面元素聚类处理之前,所述方法还包括:根据来源地址对页面合成数据组进行有效性过滤,得到有效...

【专利技术属性】
技术研发人员:郑辉唐蓉
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1