用户行为采集方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36097329 阅读:14 留言:0更新日期:2022-12-24 11:16
本发明专利技术涉及计算机技术领域,提供一种用户行为采集方法、装置、电子设备及存储介质,其中方法包括:基于埋点类型和采集配置信息,初始化JS探针,得到探针对象;埋点类型包括全埋点和代码埋点;基于探针对象,在埋点类型为全埋点的场景下,捕获当前页面的页面操作事件,应用页面操作事件对应的页面节点到当前页面的根节点的节点路径,并获取节点路径中各节点的类型和属性标签;基于各节点的类型和属性标签,应用预设节点类型和预设属性标签,得到待上报用户行为数据,并将待上报用户行为数据发送至服务器,实现了通过配置节点类型,以及在页面静态代码中配置属性标签即可以完成全埋点的行为数据采集,降低了数据分析成本。降低了数据分析成本。降低了数据分析成本。

【技术实现步骤摘要】
用户行为采集方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种用户行为采集方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网技术的飞速发展,互联网上的网页和网站数量以爆炸性的趋势增长,从而使互联网成为一个巨大的、分布广泛的数据源。Web数据采集被广泛应用于搜索引擎检索、内容安全检测、用户兴趣挖掘,以及个性化信息获取等多种服务和研究当中。
[0003]目前,Web数据采集是应用埋点技术对用户行为进行采集,但现有的埋点方式有三种:代码埋点、全埋点和可视化埋点。代码埋点的开发成本太高;可视化埋点需要额外开发可视化平台,同时需要在开发时为各节点定义唯一标识,也有着较高的开发成本;全埋点则是通过将前端的操作行为全部形成行为数据发送至服务器,由服务器进行行为数据筛选,服务器后期进行数据分析的成本较大。

技术实现思路

[0004]本专利技术提供一种用户行为采集方法、装置、电子设备及存储介质,用以解决现有技术中在全埋点由服务器进行数据筛选导致数据分析的压力较大的缺陷。
[0005]本专利技术提供一种用户行为采集方法,包括:基于埋点类型和采集配置信息,初始化JS探针,得到探针对象;所述埋点类型包括全埋点和代码埋点;所述采集配置信息包括系统五位码和来源端;基于所述探针对象,在所述埋点类型为全埋点的场景下,捕获当前页面的页面操作事件,应用所述页面操作事件对应的页面节点到所述当前页面的根节点的节点路径,并获取所述节点路径中各节点的类型和属性标签;基于所述各节点的类型和属性标签,应用预设节点类型和预设属性标签,得到待上报用户行为数据,并将所述待上报用户行为数据发送至所述服务器。
[0006]根据本专利技术提供的一种用户行为采集方法,所述基于埋点类型和采集配置信息,初始化JS探针,得到探针对象,包括:基于所述JS探针,生成未初始探针对象;基于所述未初始探针对象中的初始化函数,生成访问者ID和会话ID,并将所述埋点类型、所述采集配置信息、所述访问者ID和所述会话ID缓存于所述未初始探针对象中,得到所述探针对象;所述访问者ID是基于浏览器指纹技术生成的;所述会话ID是基于所述访问者ID、时间戳和随机数生成的。
[0007]根据本专利技术提供的一种用户行为采集方法,所述预设属性标签包括非采集属性标签和采集属性标签;所述基于所述各节点的类型和属性标签,应用预设节点类型和预设属性标签,得
到待上报用户行为数据,并将所述待上报用户行为数据发送至服务器,包括:基于所述节点路径,确定所述各节点的路径层级;所述当前页面的根节点的路径层级为最底层;所述页面节点的路径层级为最高层;基于所述各节点的类型,应用所述预设节点类型,确定采集节点和非采集节点;并基于所述采集节点和所述非采集属性标签,确定第一候选节点,同时基于所述非采集节点和所述采集属性标签,确定第二候选节点;将所述第一候选节点和所述第二候选节点中路径层级最高的节点作为待采集数据节点;基于所述待采集数据节点,采集所述待上报用户行为数据;将所述待上报用户行为数据添加至采集数据队列,并应用预设时长重置定时器;若所述采集数据队列中的数据个数达到预设阈值,或者所述定时器达到所述预设时长,则将所述采集数据队列中的数据发送至所述服务器。
[0008]根据本专利技术提供的一种用户行为采集方法,所述采集配置信息还包括:节点名获取回调函数;所述节点名获取回调函数用于所述待采集数据节点调用,并返回节点名称;所述基于所述待采集数据节点,采集所述待上报用户行为数据,包括:基于所述待采集数据节点的名称属性值、所述JS探针初始化时传入的回调函数、所述待采集数据节点的显示名称、所述待采集数据节点的标题和所述待采集数据节点的html内容,确定节点采集数据;基于所述节点采集数据、所述采集配置信息、所述访问者ID和所述会话ID,确定所述待上报用户行为数据。
[0009]根据本专利技术提供的一种用户行为采集方法,还包括:基于所述探针对象,在所述埋点类型为代码埋点的场景下,响应所述当前页面中被埋点节点的操作事件,应用所述被埋点节点,确定节点采集数据;若所述操作事件的响应函数中携带有自定义数据,则基于所述节点采集数据、所述自定义数据、所述采集配置信息、所述访问者ID和所述会话ID,确定所述待上报用户行为数据;否则,基于所述节点采集数据、所述采集配置信息、所述访问者ID和所述会话ID,确定所述待上报用户行为数据;将所述待上报用户行为数据发送至所述服务器。
[0010]根据本专利技术提供的一种用户行为采集方法,还包括:基于所述探针对象,响应待加载页面的页面加载完成事件,生成所述待加载页面的页面ID,以及确定所述待加载页面的性能指标和访问数据;将应用所述待加载页面的页面ID、所述性能指标、所述访问数据、所述采集配置信息、所述访问者ID和所述会话ID所确定的页面访问行为数据发送至所述服务器,并将所述待加载页面的页面ID、所述待加载页面的URL、所述待加载页面的标题以及所述待加载页面的停留时长作为一条记录写入本地存储;所述待加载页面的停留时长每一秒钟会根据所述待加载页面的页面ID在所述本地存储中进行更新。
[0011]根据本专利技术提供的一种用户行为采集方法,还包括:基于所述探针对象,响应待关闭页面的页面关闭前置事件,应用所述待关闭页面的页面ID在所述本地存储中进行查询,得到所述待关闭页面的页面ID对应的记录;将应用
所述待关闭页面的页面ID对应的记录、所述采集配置信息、所述访问者ID和所述会话ID所确定的页面访问时长数据发送至所述服务器,并从所述本地存储中删除所述待关闭页面的页面ID对应的记录。
[0012]本专利技术还提供一种用户行为采集装置,包括:初始化模块,用于基于埋点类型和采集配置信息,初始化JS探针,得到探针对象;所述埋点类型包括全埋点和代码埋点;所述采集配置信息包括系统五位码和来源端;节点模块,用于基于所述探针对象,在所述埋点类型为全埋点的场景下,捕获当前页面的页面操作事件,应用所述页面操作事件对应的页面节点到所述当前页面的根节点的节点路径,并获取所述节点路径中各节点的类型和属性标签;采集模块,用于基于所述各节点的类型和属性标签,应用预设节点类型和预设属性标签,得到待上报用户行为数据,并将所述待上报用户行为数据发送至服务器。
[0013]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述用户行为采集方法。
[0014]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述用户行为采集方法。
[0015]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述用户行为采集方法。
[0016]本专利技术提供的用户行为采集方法、装置、电子设备及存储介质,在全埋点的场景下通过捕获页面操作事件,得到页面操作时间对应的页面节点,查找该页面节点到根节点的节点路径,使用预设节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户行为采集方法,其特征在于,包括:基于埋点类型和采集配置信息,初始化JS探针,得到探针对象;所述埋点类型包括全埋点和代码埋点;所述采集配置信息包括系统五位码和来源端;基于所述探针对象,在所述埋点类型为全埋点的场景下,捕获当前页面的页面操作事件,应用所述页面操作事件对应的页面节点到所述当前页面的根节点的节点路径,并获取所述节点路径中各节点的类型和属性标签;基于所述各节点的类型和属性标签,应用预设节点类型和预设属性标签,得到待上报用户行为数据,并将所述待上报用户行为数据发送至服务器。2.根据权利要求1所述的用户行为采集方法,其特征在于,所述基于埋点类型和采集配置信息,初始化JS探针,得到探针对象,包括:基于所述JS探针,生成未初始探针对象;基于所述未初始探针对象中的初始化函数,生成访问者ID和会话ID,并将所述埋点类型、所述采集配置信息、所述访问者ID和所述会话ID缓存于所述未初始探针对象中,得到所述探针对象;所述访问者ID是基于浏览器指纹技术生成的;所述会话ID是基于所述访问者ID、时间戳和随机数生成的。3.根据权利要求2所述的用户行为采集方法,其特征在于,所述预设属性标签包括非采集属性标签和采集属性标签;所述基于所述各节点的类型和属性标签,应用预设节点类型和预设属性标签,得到待上报用户行为数据,并将所述待上报用户行为数据发送至服务器,包括:基于所述节点路径,确定所述各节点的路径层级;所述当前页面的根节点的路径层级为最底层;所述页面节点的路径层级为最高层;基于所述各节点的类型,应用所述预设节点类型,确定采集节点和非采集节点;并基于所述采集节点和所述非采集属性标签,确定第一候选节点,同时基于所述非采集节点和所述采集属性标签,确定第二候选节点;将所述第一候选节点和所述第二候选节点中路径层级最高的节点作为待采集数据节点;基于所述待采集数据节点,采集所述待上报用户行为数据;将所述待上报用户行为数据添加至采集数据队列,并应用预设时长重置定时器;若所述采集数据队列中的数据个数达到预设阈值,或者所述定时器达到所述预设时长,则将所述采集数据队列中的数据发送至所述服务器。4.根据权利要求3所述的用户行为采集方法,其特征在于,所述采集配置信息还包括:节点名获取回调函数;所述节点名获取回调函数用于所述待采集数据节点调用,并返回节点名称;所述基于所述待采集数据节点,采集所述待上报用户行为数据,包括:基于所述待采集数据节点的名称属性值、所述JS探针初始化时传入的回调函数、所述待采集数据节点的显示名称、所述待采集数据节点的标题和所述待采集数据节点的html内容,确定节点采集数据;基于所述节点采集数据、所述采集配置信息、所述访问者ID和所述会话ID,确定所述待
上报用户行为数据。5....

【专利技术属性】
技术研发人员:苗方田谢骏张文凯周佳玉王贵松勉玉静张紫薇张培杰陈超王莉莉
申请(专利权)人:中国外运股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1