数据收集方法和装置制造方法及图纸

技术编号:29288243 阅读:9 留言:0更新日期:2021-07-17 00:10
本发明专利技术公开了一种数据收集方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:在目标程序中引入预设的数据收集组件;使用数据收集组件包裹目标程序页面的待监测区域,以使数据收集组件中包括的数据采集方法与待监测区域的事件或生命周期方法绑定;当待监测区域的任一事件或任一生命周期方法被触发时,利用该事件或该生命周期方法绑定的数据采集方法生成记录数据;其中,所述记录数据中包括该事件被触发的时间信息和/或坐标信息、或者该生命周期方法被触发的时间信息。该实施方式能够实现目标程序中用户行为数据的全局监听,还能灵活地选取目标程序页面的待监测区域。域。域。

【技术实现步骤摘要】
数据收集方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种数据收集方法和装置。

技术介绍

[0002]微信小程序(简称小程序,英文名Mini Program)是一种不需要下载安装即可使用的应用。实际应用中,需要监听、采集并分析发生在微信小程序的用户行为数据来实现各种功能,但是现有技术中缺少微信小程序中全局监听并采集用户行为数据的方法。此外,微信小程序中存在反作弊需求,现有技术中一般通过利用页面浏览时间、IP(Internet Protocol,互联网协议)画像、Cookie文件来判定作弊行为,例如,当页面浏览时间太长或太短、点击行为集中在同一局域网或者对应于同一Cookie文件的点击行为太多时可判定作弊行为,这种判定方式需要大量数据支撑,不适合微信小程序。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供一种数据收集方法和装置,能够实现目标程序中用户行为数据的全局监听,还能灵活地选取目标程序页面的待监测区域。
[0004]为实现上述目的,根据本专利技术的一个方面,提供了一种数据收集方法。
[0005]本专利技术实施例的数据收集方法包括:在目标程序中引入预设的数据收集组件;使用数据收集组件包裹目标程序页面的待监测区域,以使数据收集组件中包括的数据采集方法与待监测区域的事件或生命周期方法绑定;当待监测区域的任一事件或任一生命周期方法被触发时,利用该事件或该生命周期方法绑定的数据采集方法生成记录数据;其中,所述记录数据中包括该事件被触发的时间信息和/或坐标信息、或者该生命周期方法被触发的时间信息。
[0006]可选地,目标程序包括微信小程序;以及,在目标程序中引入预设的数据收集组件,包括:在目标程序的配置文件中对数据收集组件进行引用声明,并设置数据收集组件对应的标签名。
[0007]可选地,使用数据收集组件包裹目标程序页面的待监测区域,包括:将待监测区域的页面代码置入以所述标签名命名的开始标签和结束标签之间。
[0008]可选地,待监测区域的事件或生命周期方法被用户行为所触发,用户行为包括:点击行为、滑动行为、进入页面行为和/或离开页面行为;待监测区域的事件包括触摸开始事件、触摸移动事件和/或触摸结束事件,待监测区域的生命周期方法包括进入页面方法和/或离开页面方法;其中,点击行为触发触摸开始事件和触摸结束事件,产生点击数据;该点击数据中包括该触摸开始事件和该触摸结束事件被触发时生成的记录数据;滑动行为触发触摸开始事件、触摸移动事件和触摸结束事件,产生滑动数据;该滑动数据中包括该触摸开始事件、该触摸移动事件和该触摸结束事件被触发时生成的记录数据;进入页面行为触发进入页面方法,产生进入页面数据;该进入页面数据中包括该进入页面方法被触发时生成的记录数据;离开页面行为触发离开页面方法,产生离开页面数据;该离开页面数据中包括
该离开页面方法被触发时生成的记录数据。
[0009]可选地,任一点击数据中的两条记录数据具有同一坐标信息;以及,所述方法进一步包括:通过数据收集组件中包括的脚本文件执行以下步骤:将任一点击数据中两条记录数据的时间信息相减,得到点击时长信息;将点击时长信息和该点击数据中记录数据的坐标信息组成点击统计数据;从任一滑动数据中按照时间信息升序或降序等间隔地选取部分记录数据作为样本,将任一样本中的时间信息替换为相邻采样点时长信息;其中,经所述替换后的形成的样本组成滑动统计数据,相邻采样点时长信息为所述任一样本与该样本的前一样本的时间信息差值。
[0010]可选地,所述方法进一步包括:通过所述脚本文件执行以下步骤:从待监测区域中确定验证信息码,使用服务端提供的密钥对待上传数据和验证信息码加密,形成加密数据;其中,待上传数据包括用户行为数据和/或统计数据,用户行为数据包括点击数据、滑动数据、进入页面数据和/或离开页面数据,统计数据包括点击统计数据、滑动统计数据和/或加工进入页面数据和离开页面数据形成的数据;将加密数据上传到服务端。
[0011]可选地,所述加密数据中的用户行为数据或统计数据用于根据以下步骤执行作弊行为判定:在任一点击统计数据中的点击时长信息未处于预设的第一范围时,判定该点击统计数据对应的用户行为是作弊行为;在任一滑动统计数据中样本的相邻采样点时长信息之和未处于预设的第二范围时,判定该滑动统计数据对应的用户行为是作弊行为;在任一滑动统计数据中确定与前一样本的欧式距离大于预设距离的样本的数量;当该数量大于预设的第一阈值,则判定该滑动统计数据对应的用户行为是作弊行为;根据任一滑动统计数据中样本的坐标信息确定滑动轨迹;当该滑动轨迹不符合预设规则,则判定该滑动统计数据对应的用户行为是作弊行为;在确定任一滑动统计数据中各样本的相邻采样点时长信息的变化幅度小于预设的第二阈值时,判定该滑动统计数据对应的用户行为是作弊行为;在利用样本的坐标信息确定任一滑动统计数据中存在脱离显示屏幕范围的样本时,判定该滑动统计数据对应的用户行为是作弊行为;确定基于任一进入页面数据的预设时间窗口内存在的、与该进入页面数据对应于同一待监测区域的点击数据的数量;当该数量大于预设的第三阈值,则判定该进入页面数据和该点击数据对应的用户行为是作弊行为;其中,所述时间窗口从该进入页面数据中的时间信息开始,所述时间窗口的时长为预设的第一时长。
[0012]为实现上述目的,根据本专利技术的另一方面,提供了一种数据收集装置。
[0013]本专利技术实施例的数据收集装置可包括:引入单元,用于在目标程序中引入预设的数据收集组件;绑定单元,用于使用数据收集组件包裹目标程序页面的待监测区域,以使数据收集组件中包括的数据采集方法与待监测区域的事件或生命周期方法绑定;记录生成单元,用于:当待监测区域的任一事件或任一生命周期方法被触发时,利用该事件或该生命周期方法绑定的数据采集方法生成记录数据;其中,所述记录数据中包括该事件被触发的时间信息和/或坐标信息、或者该生命周期方法被触发的时间信息。
[0014]为实现上述目的,根据本专利技术的又一方面,提供了一种电子设备。
[0015]本专利技术的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术所提供的数据收集方法。
[0016]为实现上述目的,根据本专利技术的再一方面,提供了一种计算机可读存储介质。
[0017]本专利技术的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术所提供的数据收集方法。
[0018]根据本专利技术的技术方案,上述专利技术中的一个实施例具有如下优点或有益效果:通过将预设的数据采集方法封装为数据收集组件并引入目标程序,使用数据收集组件包裹目标程序页面的待监测区域,从而使数据采集方法与待监测区域的事件或生命周期方法绑定。当用户行为发生在待监测区域时,触发相应的事件或生命周期方法,从而执行绑定的数据采集方法,生成用户行为对应的记录数据。这样,既可实现目标程序中用户行为的全局监听,又可根据需要灵活选取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据收集方法,其特征在于,包括:在目标程序中引入预设的数据收集组件;使用数据收集组件包裹目标程序页面的待监测区域,以使数据收集组件中包括的数据采集方法与待监测区域的事件或生命周期方法绑定;当待监测区域的任一事件或任一生命周期方法被触发时,利用该事件或该生命周期方法绑定的数据采集方法生成记录数据;其中,所述记录数据中包括该事件被触发的时间信息和/或坐标信息、或者该生命周期方法被触发的时间信息。2.根据权利要求1所述的数据收集方法,其特征在于,目标程序包括微信小程序;以及,在目标程序中引入预设的数据收集组件,包括:在目标程序的配置文件中对数据收集组件进行引用声明,并设置数据收集组件对应的标签名。3.根据权利要求2所述的数据收集方法,其特征在于,使用数据收集组件包裹目标程序页面的待监测区域,包括:将待监测区域的页面代码置入以所述标签名命名的开始标签和结束标签之间。4.根据权利要求1所述的数据收集方法,其特征在于,待监测区域的事件或生命周期方法被用户行为所触发,用户行为包括:点击行为、滑动行为、进入页面行为和/或离开页面行为;待监测区域的事件包括触摸开始事件、触摸移动事件和/或触摸结束事件,待监测区域的生命周期方法包括进入页面方法和/或离开页面方法;其中,点击行为触发触摸开始事件和触摸结束事件,产生点击数据;该点击数据中包括该触摸开始事件和该触摸结束事件被触发时生成的记录数据;滑动行为触发触摸开始事件、触摸移动事件和触摸结束事件,产生滑动数据;该滑动数据中包括该触摸开始事件、该触摸移动事件和该触摸结束事件被触发时生成的记录数据;进入页面行为触发进入页面方法,产生进入页面数据;该进入页面数据中包括该进入页面方法被触发时生成的记录数据;离开页面行为触发离开页面方法,产生离开页面数据;该离开页面数据中包括该离开页面方法被触发时生成的记录数据。5.根据权利要求4所述的数据收集方法,其特征在于,任一点击数据中的两条记录数据具有同一坐标信息;以及,所述方法进一步包括:通过数据收集组件中包括的脚本文件执行以下步骤:将任一点击数据中两条记录数据的时间信息相减,得到点击时长信息;将点击时长信息和该点击数据中记录数据的坐标信息组成点击统计数据;从任一滑动数据中按照时间信息升序或降序等间隔地选取部分记录数据作为样本,将任一样本中的时间信息替换为相邻采样点时长信息;其中,经所述替换后的形成的样本组成滑动统计数据,相邻采样点时长信息为所述任一样本与该样本的前一样本的时间信息差值。6.根据权利要求5所述的数据收集方法,其特征在于,所述方法进一步包括:通过所述脚本文件执行以下步骤:从待监测区域中确定验证信息码...

【专利技术属性】
技术研发人员:李瑞芳张超
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1