【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及数据分析
,尤其涉及一种数据处理方法及装置。
技术介绍
目前,越来越多的应用通过采集用户使用应用时的用户行为数据,对用户行为进行分析,以明确用户需求,改善应用的功能,其中,用户行为数据可以包括:用户点击行为数据(包括用户点击的位置以及点击次数)、用户浏览行为数据(包括用户浏览的页面信息以及浏览次数)以及用户执行业务的业务信息等。以分析用户在网页应用中的点击为例,在现有技术中,为了避免对网页应用代码进行更改,通常采用的无埋点技术采集用户行为数据。具体的,通过用户使用的网页应用中载入的埋点软件开发工具包(SoftwareDevelopmentKit,SDK),获取用户在网页应用的页面中的点击事件,并确定点击事件的特征标识,将确定出的点击事件的特征标识发送至数据库中进行存储,以当需要进行数据分析时,根据存储的点击事件的特征标识,对用户行为进行分析。但是,现有技术SDK获取点击事件的特征标识为页面元素的文本内容或页面元素的页面路径中的一种。当页面中存在文本内容相同的页面元素时,根据特征标识难以准确的确定用户点击事件的对象。例如,某应用页面中同时存在两个商品的购买按键,按键上的文本内容均为“购买”,则对这两个购买按键进行点击后,获取的特征标识相同。当页面中存在页面路径相同的页面元素时,根据特征标识难以准确的确定用户点击事件的对象。例如,某应用页面中C商品的添加按键和删除按键的页面路径相同,均为W/X/Y/Z,则仅根据页面路径,无法区分添加按键和删除按键为不同页面元素。导致目前数据 ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n通过监测代码监测用户在目标应用中的点击事件,所述目标应用是由若干页面组件构成,每个页面组件分别配置有全局唯一的组件标识;/n针对每个点击事件,确定该点击事件对应的页面元素,并确定所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识;/n根据确定出的所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识,确定该点击事件的特征标识;/n将确定出的各点击事件的特征标识发送至指定服务器进行存储,以当需要进行数据处理时,根据存储的各点击事件的特征标识,进行数据处理。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
通过监测代码监测用户在目标应用中的点击事件,所述目标应用是由若干页面组件构成,每个页面组件分别配置有全局唯一的组件标识;
针对每个点击事件,确定该点击事件对应的页面元素,并确定所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识;
根据确定出的所述页面元素的目标内容、所述页面元素的页面路径以及所述页面元素所属页面组件的组件标识,确定该点击事件的特征标识;
将确定出的各点击事件的特征标识发送至指定服务器进行存储,以当需要进行数据处理时,根据存储的各点击事件的特征标识,进行数据处理。
2.如权利要求1所述的方法,其特征在于,确定所述页面元素所属页面组件的组件标识,具体包括:
获取点击事件对应的页面元素的路径属性;
针对每个点击事件对应的页面元素,根据该页面元素的路径属性,按照顺序依次获取该页面元素的页面路径中的各节点,直至获取到页面组件对应的节点时,根据所述页面组件对应的节点,确定所述页面组件的组件标识,作为所述页面元素所属页面组件的组件标识。
3.如权利要求2所述的方法,其特征在于,确定所述页面元素的页面路径,具体包括:
根据获取到的处于所述页面组件与所述页面元素之间的节点,确定所述页面元素在所述页面组件中的路径;
将确定出的所述页面元素在所述页面组件中的路径,作为用于确定该点击事件的特征标识的所述页面元素的页面路径。
4.如权利要求1所述的方法,其特征在于,确定所述页面元素的目标内容,具体包括:
判断所述页面元素的文本属性是否为空;
若是,则将所述页面元素的超文本引用属性中的统一资源定位符作为所述页面元素的目标内容;
若否,则将所述页面元素的文本属性中的文本内容作为所述页面元素的目标内容。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述目标应用当前展示的页面中的各页面元素;
针对确定出的各页面元素,根据所述当前展示的页面的页面尺寸、该页面元素在所述当前展示的页面中的位置以及监测到的页面变化事件,确定该页面元素在所述当前展示的页面暴露的面积;
当暴露的面积大于预设值且暴露时长大于预设时长时,将携带曝光信息的该页面元素的特征标识发送至所述指定服务器;
其中,页面变化事件至少包括页面的滚动事件以及页面的尺寸变化事件。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
针对每个待存储的特征标识,当该待存储的特征标识与已存储的特征标识包含的组件标识和目标内容均相同,且该待存储的特征标识包含的页面路径与所述已存储的特征标识包含的页面路径呈包含关系时,确定该待存储的特征标识与所述已存储的特征标识为同一点击事件的特征标识。
7.一种数据处理方法,其特征在于,包括:
目...
【专利技术属性】
技术研发人员:孙光,张歆琳,周遥,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。