一种数据处理方法及装置制造方法及图纸

技术编号:25396092 阅读:14 留言:0更新日期:2020-08-25 23:01
本说明书公开了一种数据处理方法及装置,在进行数据处理时,可先通过监测代码监测用户在目标应用中的点击事件,之后针对每个点击事件,确定该点击事件对应的页面元素,并确定该页面元素的目标内容、该页面元素的页面路径以及该页面元素所属页面组件的组件标识,以确定该点击事件的特征标识,最后将确定出的各点击事件的特征标识发送至指定服务器进行存储,使得当需要进行数据处理时,可根据存储的各点击事件的特征标识,进行数据处理。通过将页面元素的目标内容、页面元素的页面路径以及页面元素所属页面组件的组件标识相结合的方式,确定点击事件的特征标识,以使特征标识能唯一表示用户在目标应用中的点击事件,数据处理效果更好。

【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及数据分析
,尤其涉及一种数据处理方法及装置。
技术介绍
目前,越来越多的应用通过采集用户使用应用时的用户行为数据,对用户行为进行分析,以明确用户需求,改善应用的功能,其中,用户行为数据可以包括:用户点击行为数据(包括用户点击的位置以及点击次数)、用户浏览行为数据(包括用户浏览的页面信息以及浏览次数)以及用户执行业务的业务信息等。以分析用户在网页应用中的点击为例,在现有技术中,为了避免对网页应用代码进行更改,通常采用的无埋点技术采集用户行为数据。具体的,通过用户使用的网页应用中载入的埋点软件开发工具包(SoftwareDevelopmentKit,SDK),获取用户在网页应用的页面中的点击事件,并确定点击事件的特征标识,将确定出的点击事件的特征标识发送至数据库中进行存储,以当需要进行数据分析时,根据存储的点击事件的特征标识,对用户行为进行分析。但是,现有技术SDK获取点击事件的特征标识为页面元素的文本内容或页面元素的页面路径中的一种。当页面中存在文本内容相同的页面元素时,根据特征标识难以准确的确定用户点击事件的对象。例如,某应用页面中同时存在两个商品的购买按键,按键上的文本内容均为“购买”,则对这两个购买按键进行点击后,获取的特征标识相同。当页面中存在页面路径相同的页面元素时,根据特征标识难以准确的确定用户点击事件的对象。例如,某应用页面中C商品的添加按键和删除按键的页面路径相同,均为W/X/Y/Z,则仅根据页面路径,无法区分添加按键和删除按键为不同页面元素。导致目前数据采集不准确,数据分析效果较差。
技术实现思路
本说明书实施例提供一种数据处理方法及装置,用于部分解决现有技术中存在的上述问题。本说明书实施例采用下述技术方案:本说明书提供的一种数据处理方法,包括:通过监测代码监测用户在目标应用中的点击事件,所述目标应用是由若干页面组件构成,每个页面组件分别配置有全局唯一的组件标识;针对每个点击事件,确定该点击事件对应的页面元素,并确定所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识;根据确定出的所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识,确定该点击事件的特征标识;将确定出的各点击事件的特征标识发送至指定服务器进行存储,以当需要进行数据处理时,根据存储的各点击事件的特征标识,进行数据处理。可选地,确定所述页面元素所属页面组件的组件标识,具体包括:获取点击事件对应的页面元素的路径属性;针对每个点击事件对应的页面元素,根据该页面元素的路径属性,按照顺序依次获取该页面元素的页面路径中的各节点,直至获取到页面组件对应的节点时,根据所述页面组件对应的节点,确定所述页面组件的组件标识,作为所述页面元素所属页面组件的组件标识。可选地,确定所述页面元素的页面路径,具体包括:根据获取到的处于所述页面组件与所述页面元素之间的节点,确定所述页面元素在所述页面组件中的路径;将确定出的所述页面元素在所述页面组件中的路径,作为用于确定该点击事件的特征标识的所述页面元素的页面路径。可选地,确定所述页面元素的目标内容,具体包括:判断所述页面元素的文本属性是否为空;若是,则将所述页面元素的超文本引用属性中的统一资源定位符作为所述页面元素的目标内容;若否,则将所述页面元素的文本属性中的文本内容作为所述页面元素的目标内容。可选地,所述方法还包括:确定所述目标应用当前展示的页面中的各页面元素;针对确定出的各页面元素,根据所述当前展示的页面的页面尺寸、该页面元素在所述当前展示的页面中的位置以及监测到的页面变化事件,确定该页面元素在所述当前展示的页面暴露的面积;当暴露的面积大于预设值且暴露时长大于预设时长时,将携带曝光信息的该页面元素的特征标识发送至所述指定服务器;其中,页面变化事件至少包括页面的滚动事件以及页面的尺寸变化事件。可选地,所述方法还包括:针对每个待存储的特征标识,当该待存储的特征标识与已存储的特征标识包含的组件标识和目标内容均相同,且该待存储的特征标识包含的页面路径与所述已存储的特征标识包含的页面路径呈包含关系时,确定该待存储的特征标识与所述已存储的特征标识为同一点击事件的特征标识。本说明书提供的另一种数据处理方法,包括:目标应用根据用户操作,向配置平台发送配置请求;接收所述配置平台返回的圈选代码;通过所述目标应用中的监测代码运行所述圈选代码;当监测到所述用户在所述目标应用中的点击事件时,通过所述圈选代码展示规则配置页面;根据所述用户在所述规则配置页面中的操作,将所述点击事件的特征标识作为数据处理目标,发送至指定服务器进行存储,以当需要进行数据处理时,根据存储的数据处理目标以及各点击事件的特征标识,进行数据处理;其中,所述点击事件的特征标识根据所述点击事件对应的页面元素的目标内容、页面元素的页面路径以及页面元素所属页面组件的组件标识确定。可选地,所述方法还包括:当所述用户在所述配置平台点击结束配置时,所述目标应用接收所述配置平台发送的结束指令;通过所述监测代码删除所述圈选代码以及运行所述圈选代码时生成的其他代码。本说明书提供的一种数据处理装置,包括:监测模块,通过监测代码监测用户在目标应用中的点击事件,所述目标应用是由若干页面组件构成,每个页面组件分别配置有全局唯一的组件标识;页面元素确定模块,针对每个点击事件,确定该点击事件对应的页面元素,并确定所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识;特征标识确定模块,根据确定出的所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识,确定该点击事件的特征标识;数据处理模块,将确定出的各点击事件的特征标识发送至指定服务器进行存储,以当需要进行数据处理时,根据存储的各点击事件的特征标识,进行数据处理。本说明书提供的另一种数据处理装置,包括:配置模块,目标应用根据用户操作,向配置平台发送配置请求;接收模块,接收所述配置平台返回的圈选代码;运行模块,通过所述目标应用中的监测代码运行所述圈选代码;展示模块,当监测到所述用户在所述目标应用中的点击事件时,通过所述圈选代码展示规则配置页面;数据处理模块,根据所述用户在所述规则配置页面中的操作,将所述点击事件的特征标识作为数据处理目标,发送至指定服务器进行存储,以当需要进行数据处理时,根据存储的数据处理目标以及各点击事件的特征标识,进行数据处理;其中,所述点击事件的特征标识根据所述点击事件对应的页面元素的目标内容、页面元素的页面路径以及页面元素所属页面组件的组件标识确定。本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机本文档来自技高网
...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n通过监测代码监测用户在目标应用中的点击事件,所述目标应用是由若干页面组件构成,每个页面组件分别配置有全局唯一的组件标识;/n针对每个点击事件,确定该点击事件对应的页面元素,并确定所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识;/n根据确定出的所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识,确定该点击事件的特征标识;/n将确定出的各点击事件的特征标识发送至指定服务器进行存储,以当需要进行数据处理时,根据存储的各点击事件的特征标识,进行数据处理。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
通过监测代码监测用户在目标应用中的点击事件,所述目标应用是由若干页面组件构成,每个页面组件分别配置有全局唯一的组件标识;
针对每个点击事件,确定该点击事件对应的页面元素,并确定所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识;
根据确定出的所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识,确定该点击事件的特征标识;
将确定出的各点击事件的特征标识发送至指定服务器进行存储,以当需要进行数据处理时,根据存储的各点击事件的特征标识,进行数据处理。


2.如权利要求1所述的方法,其特征在于,确定所述页面元素所属页面组件的组件标识,具体包括:
获取点击事件对应的页面元素的路径属性;
针对每个点击事件对应的页面元素,根据该页面元素的路径属性,按照顺序依次获取该页面元素的页面路径中的各节点,直至获取到页面组件对应的节点时,根据所述页面组件对应的节点,确定所述页面组件的组件标识,作为所述页面元素所属页面组件的组件标识。


3.如权利要求2所述的方法,其特征在于,确定所述页面元素的页面路径,具体包括:
根据获取到的处于所述页面组件与所述页面元素之间的节点,确定所述页面元素在所述页面组件中的路径;
将确定出的所述页面元素在所述页面组件中的路径,作为用于确定该点击事件的特征标识的所述页面元素的页面路径。


4.如权利要求1所述的方法,其特征在于,确定所述页面元素的目标内容,具体包括:
判断所述页面元素的文本属性是否为空;
若是,则将所述页面元素的超文本引用属性中的统一资源定位符作为所述页面元素的目标内容;
若否,则将所述页面元素的文本属性中的文本内容作为所述页面元素的目标内容。


5.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述目标应用当前展示的页面中的各页面元素;
针对确定出的各页面元素,根据所述当前展示的页面的页面尺寸、该页面元素在所述当前展示的页面中的位置以及监测到的页面变化事件,确定该页面元素在所述当前展示的页面暴露的面积;
当暴露的面积大于预设值且暴露时长大于预设时长时,将携带曝光信息的该页面元素的特征标识发送至所述指定服务器;
其中,页面变化事件至少包括页面的滚动事件以及页面的尺寸变化事件。


6.如权利要求1所述的方法,其特征在于,所述方法还包括:
针对每个待存储的特征标识,当该待存储的特征标识与已存储的特征标识包含的组件标识和目标内容均相同,且该待存储的特征标识包含的页面路径与所述已存储的特征标识包含的页面路径呈包含关系时,确定该待存储的特征标识与所述已存储的特征标识为同一点击事件的特征标识。


7.一种数据处理方法,其特征在于,包括:
目...

【专利技术属性】
技术研发人员:孙光张歆琳周遥
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1