【技术实现步骤摘要】
网站用户行为分析方法及装置
本专利技术涉及数据处理
,尤其涉及一种网站用户行为分析方法及装置。
技术介绍
目前的网站用户行为分析方法主要包括:获取网站对应的点击日志,点击日志中包括多条点击记录,每条点击记录中包括:网页标识+元素标识+点击在网页元素内的偏移量所占的百分比,例如X轴百分比和Y轴百分比;根据该点击日志分析网站用户行为。然而,上述方案中,为了确保采集到的点击日志的准确度,例如,点击位置精确到元素的百分之一,则需要将网页中的每个元素分为一万个点,这种分法导致采集到的点击记录数据量过大,对点击日志的分析时间过长,从而导致网站用户行为的分析效率很差。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种网站用户行为分析方法,用于解决现有技术中点击记录数据量过大,导致网站用户行为分析效率差的问题。本专利技术的第二个目的在于提出一种网站用户行为分析装置。本专利技术的第三个目的在于提出另一种网站用户行为分析装置。r>本专利技术的第四本文档来自技高网...
【技术保护点】
1.一种网站用户行为分析方法,其特征在于,包括:/n获取网站对应的点击日志,所述点击日志中包括:用户对所述网站中各网页的点击记录;每条点击记录中包括:网页标识、网页内被点击的元素标识、点击在元素内的偏移坐标、元素的尺寸信息;/n针对每条点击记录,结合预设的离散化函数以及元素的尺寸信息,对所述偏移坐标进行离散化,得到离散后的偏移坐标,生成离散后点击记录,以将一定范围内的偏移坐标聚合到同一个离散后的偏移坐标;/n针对每个离散后点击记录,获取与所述离散后点击记录对应的点击记录的数量,将所述数量确定为离散后点击记录对应的点击数;/n根据每个离散后点击记录以及对应的点击数,对网站用户行为进行分析。/n
【技术特征摘要】
1.一种网站用户行为分析方法,其特征在于,包括:
获取网站对应的点击日志,所述点击日志中包括:用户对所述网站中各网页的点击记录;每条点击记录中包括:网页标识、网页内被点击的元素标识、点击在元素内的偏移坐标、元素的尺寸信息;
针对每条点击记录,结合预设的离散化函数以及元素的尺寸信息,对所述偏移坐标进行离散化,得到离散后的偏移坐标,生成离散后点击记录,以将一定范围内的偏移坐标聚合到同一个离散后的偏移坐标;
针对每个离散后点击记录,获取与所述离散后点击记录对应的点击记录的数量,将所述数量确定为离散后点击记录对应的点击数;
根据每个离散后点击记录以及对应的点击数,对网站用户行为进行分析。
2.根据权利要求1所述的方法,其特征在于,所述偏移坐标包括:X轴偏移坐标和Y轴偏移坐标;所述尺寸信息包括:宽度信息和高度信息;
所述针对每条点击记录,结合预设的离散化函数以及元素的尺寸信息,对所述偏移坐标进行离散化,得到离散后的偏移坐标,生成离散后点击记录,包括:
针对每条点击记录,结合预设的离散化函数以及元素的宽度信息,对所述X轴偏移坐标进行离散化,得到离散后的X轴偏移坐标,以将第一预设范围内的X轴偏移坐标聚合到同一个离散后的X轴偏移坐标;
结合预设的离散化函数以及元素的高度信息,对所述Y轴偏移坐标进行离散化,得到离散后的Y轴偏移坐标,以将第二预设范围内的Y轴偏移坐标聚合到同一个离散后的Y轴偏移坐标;
根据所述离散后的X轴偏移坐标、所述离散后的Y轴偏移坐标、所述点击记录中的网页标识以及元素标识,生成离散后点击记录。
3.根据权利要求2所述的方法,其特征在于,所述离散化函数中包括:参数d和参数p;参数d表示离散后点击之间的最小距离;参数p表示元素的每个轴上离散后点击的最大数量;
所述第一预设范围的确定方式为,
获取所述元素的宽度信息,以及参数d与参数p的乘积;
判断所述元素的宽度信息是否小于等于所述乘积;
若所述元素的宽度信息小于等于所述乘积,则将所述第一预设范围的半径确定为所述参数d的一半;
若所述元素的宽度信息大于所述乘积,则将所述第一预设范围的半径确定为宽度信息的一半与参数p的商。
4.根据权利要求3所述的方法,其特征在于,所述第二预设范围的确定方式为,
获取所述元素的高度信息,以及参数d与参数p的乘积;
判断所述元素的高度信息是否小于等于所述乘积;
若所述元素的高度信息小于等于所述乘积,则将所述第一预设范围的半径确定为所述参数d的一半;
若所述元素的高度信息大于所述乘积,则将所述第一预设范围的半径确定为高度信息的一半与参数p的商。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述X轴偏移坐标为,X轴偏移量占所述宽度信息的百分比;
所述Y轴偏移坐标为,Y轴偏移量占所述高度信息的百分比。
6.根据权利要求5所述的方法,其特征在于,所述结合预设的离散化函数以及元素的宽度信息,对所述X轴偏移坐标进行离散化,得到离散后的X轴偏移坐标的公式为,
step=d×p×1.0/w;
x=x×p/100;
xx=floor(x/step)×step+step/2;
xx=xx×100/p;
...
【专利技术属性】
技术研发人员:黄斐乔,李中艺,叶峻,高春旭,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。