【技术实现步骤摘要】
用户行为采集方法、装置、电子设备及存储介质
[0001]本专利技术涉及计算机
,尤其涉及一种用户行为采集方法、装置、电子设备及存储介质。
技术介绍
[0002]随着互联网技术的飞速发展,互联网上的网页和网站数量以爆炸性的趋势增长,从而使互联网成为一个巨大的、分布广泛的数据源。Web数据采集被广泛应用于搜索引擎检索、内容安全检测、用户兴趣挖掘,以及个性化信息获取等多种服务和研究当中。
[0003]目前,Web数据采集是应用埋点技术对用户行为进行采集,但现有的埋点方式有三种:代码埋点、全埋点和可视化埋点。代码埋点的开发成本太高;可视化埋点需要额外开发可视化平台,同时需要在开发时为各节点定义唯一标识,也有着较高的开发成本;全埋点则是通过将前端的操作行为全部形成行为数据发送至服务器,由服务器进行行为数据筛选,服务器后期进行数据分析的成本较大。
技术实现思路
[0004]本专利技术提供一种用户行为采集方法、装置、电子设备及存储介质,用以解决现有技术中在全埋点由服务器进行数据筛选导致数据分析的压力较大的缺陷 ...
【技术保护点】
【技术特征摘要】
1.一种用户行为采集方法,其特征在于,包括:基于埋点类型和采集配置信息,初始化JS探针,得到探针对象;所述埋点类型包括全埋点和代码埋点;所述采集配置信息包括系统五位码和来源端;基于所述探针对象,在所述埋点类型为全埋点的场景下,捕获当前页面的页面操作事件,应用所述页面操作事件对应的页面节点到所述当前页面的根节点的节点路径,并获取所述节点路径中各节点的类型和属性标签;基于所述各节点的类型和属性标签,应用预设节点类型和预设属性标签,得到待上报用户行为数据,并将所述待上报用户行为数据发送至服务器。2.根据权利要求1所述的用户行为采集方法,其特征在于,所述基于埋点类型和采集配置信息,初始化JS探针,得到探针对象,包括:基于所述JS探针,生成未初始探针对象;基于所述未初始探针对象中的初始化函数,生成访问者ID和会话ID,并将所述埋点类型、所述采集配置信息、所述访问者ID和所述会话ID缓存于所述未初始探针对象中,得到所述探针对象;所述访问者ID是基于浏览器指纹技术生成的;所述会话ID是基于所述访问者ID、时间戳和随机数生成的。3.根据权利要求2所述的用户行为采集方法,其特征在于,所述预设属性标签包括非采集属性标签和采集属性标签;所述基于所述各节点的类型和属性标签,应用预设节点类型和预设属性标签,得到待上报用户行为数据,并将所述待上报用户行为数据发送至服务器,包括:基于所述节点路径,确定所述各节点的路径层级;所述当前页面的根节点的路径层级为最底层;所述页面节点的路径层级为最高层;基于所述各节点的类型,应用所述预设节点类型,确定采集节点和非采集节点;并基于所述采集节点和所述非采集属性标签,确定第一候选节点,同时基于所述非采集节点和所述采集属性标签,确定第二候选节点;将所述第一候选节点和所述第二候选节点中路径层级最高的节点作为待采集数据节点;基于所述待采集数据节点,采集所述待上报用户行为数据;将所述待上报用户行为数据添加至采集数据队列,并应用预设时长重置定时器;若所述采集数据队列中的数据个数达到预设阈值,或者所述定时器达到所述预设时长,则将所述采集数据队列中的数据发送至所述服务器。4.根据权利要求3所述的用户行为采集方法,其特征在于,所述采集配置信息还包括:节点名获取回调函数;所述节点名获取回调函数用于所述待采集数据节点调用,并返回节点名称;所述基于所述待采集数据节点,采集所述待上报用户行为数据,包括:基于所述待采集数据节点的名称属性值、所述JS探针初始化时传入的回调函数、所述待采集数据节点的显示名称、所述待采集数据节点的标题和所述待采集数据节点的html内容,确定节点采集数据;基于所述节点采集数据、所述采集配置信息、所述访问者ID和所述会话ID,确定所述待
上报用户行为数据。5....
【专利技术属性】
技术研发人员:苗方田,谢骏,张文凯,周佳玉,王贵松,勉玉静,张紫薇,张培杰,陈超,王莉莉,
申请(专利权)人:中国外运股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。