基于数据标注的埋点方法和埋点数据处理方法技术

技术编号:33134142 阅读:34 留言:0更新日期:2022-04-17 00:56
本申请实施例提供了一种基于数据标注的埋点方法和埋点数据处理方法,通过响应于埋点操作,对数据标注过程进行埋点处理,得到多个目标埋点;获取在目标埋点处采集的埋点数据;将埋点数据发送给服务器,埋点数据用于指示服务器根据埋点数据确定数据分析报表。本申请实施例提供的技术方案通过对数据标注过程进行埋点处理,得到多个目标埋点,并采集多个目标埋点处的埋点数据,获取的埋点数据的细粒度和维度较高,能够保证埋点数据采集过程中数据标注服务的稳定性,使得根据埋点数据确定的数据分析报表的准确更高。分析报表的准确更高。分析报表的准确更高。

【技术实现步骤摘要】
基于数据标注的埋点方法和埋点数据处理方法


[0001]本申请涉及埋点
,尤其涉及一种基于数据标注的埋点方法和埋点数据处理方法。

技术介绍

[0002]随着机器学习的不断发展,基于机器学习算法训练的数据标注型产品语气来越多,而对于数据标注过程中产生的数据进行分析,对数据标注过程进行监控和维护等操作有着至关重要的作用。数据标注工具通常通过简单的过程跟踪来捕捉记录数据,捕捉记录的数据主要是在进行数据提交时所产生的过程记录数据,而忽略了标注过程中用户的使用操作习惯等数据的捕捉,导致捕捉记录的数据的维度和细粒度较低,无法满足复杂业务的业务需求。
[0003]目前,主要利用通用化的第三方在线服务,通过在页面的必要代码中进行代码植入的方式,将数据标注过程产生的数据捕捉记录到第三方数据库中,以提升数据的维度和细粒度。
[0004]但是,对于数据标注场景而言,由于算法训练业务规则的不同,使得数据标注的方式之间存在差异,而使用通用的第三方在线服务捕捉记录的数据不够全面,无法实现对不同的数据标注方式进行定制化捕捉记录数据,使得捕捉记录的数据的维度和细粒度较差,可能导致数据分析的准确度和全面性较差的问题。

技术实现思路

[0005]本申请实施例提供了一种基于数据标注的埋点方法和埋点数据处理方法,能够提升采集的数据标注过程的埋点数据的维度和细粒度,从而提升确定的数据分析报表的准确度和全面性。
[0006]第一方面,本申请实施例提供了一种基于数据标注的埋点方法,应用于终端设备,所述基于数据标注的埋点方法包括:
[0007]响应于埋点操作,对数据标注过程进行埋点处理,得到多个目标埋点;
[0008]获取在所述目标埋点处采集的埋点数据;
[0009]将所述埋点数据发送给服务器,所述埋点数据用于指示所述服务器根据所述埋点数据确定数据分析报表。
[0010]可选的,所述目标埋点包括第一目标埋点和第二目标埋点,所述第一目标埋点包括用户连续两次操作之间的时间间隔小于或等于预设时间间隔的埋点,所述第二目标埋点包括用户连续两次操作之间的时间间隔大于预设时间间隔的埋点;
[0011]所述获取在所述目标埋点处采集的埋点数据,包括:
[0012]分别获取在所述第一目标埋点处采集的埋点数据和在所述第二目标埋点处采集的埋点数据。
[0013]可选的,所述在所述第一目标埋点处采集的埋点数据的发送频次小于在所述第二
目标埋点处采集的埋点数据的发送频次。
[0014]可选的,所述将所述埋点数据发送给服务器,包括:
[0015]在到达预设时长后,将在所述预设时长内,在所述第一目标埋点处采集的所有埋点数据发送给所述服务器;
[0016]将在所述第二目标埋点处采集的埋点数据实时发送给所述服务器。
[0017]第二方面,本申请实施例提供了另一种埋点数据处理方法,应用于服务器,所述埋点数据处理方法包括:
[0018]接收终端设备发送的多个埋点数据,所述多个埋点数据为所述终端设备在目标埋点处采集的数据,所述目标埋点为所述终端设备在接收到埋点操作后,对数据标注过程进行埋点处理后得到的;
[0019]将所述多个埋点数据存储在埋点数据库中,所述埋点数据库中包括至少一个预设组件;
[0020]通过所述埋点数据库中的至少一个预设组件对所述数据库中的埋点数据进行处理,得到所述预设组件对应的数据分析报表。
[0021]可选的,所述将所述多个埋点数据存储在埋点数据库中,包括:
[0022]对所述多个埋点数据进行预分析处理,得到目标数据;
[0023]根据所述目标数据对应的埋点内容,将归属于同一个业务的多个目标数据按照对应的采集时刻进行连接,生成至少一个关系链路;
[0024]将所述至少一个关系链路存储至所述埋点数据库中。
[0025]可选的,对所述多个埋点数据进行预分析处理,得到目标数据,包括:
[0026]根据待分析内容对所述多个埋点数据进行内容提取,得到目标数据;
[0027]或,
[0028]根据待分析内容对从所述多个埋点数据进行内容提取后得到的数据进行再分析,得到目标数据。
[0029]可选的,在将所述多个埋点数据存储在埋点数据库中之前,所述方法包括:
[0030]判断接收的所述终端设备发送的所述多个埋点数据中每个埋点数据是否为结构化数据;
[0031]若所述埋点数据为非结构化数据,则将所述埋点数据转换为结构化数据,并将转换后的埋点数据存储至所述埋点数据库中;
[0032]若所述埋点数据为结构化数据,则直接将所述埋点数据存储至所述埋点数据库中。
[0033]可选的,在得到所述预设组件对应的数据分析报表之后,所述方法包括:
[0034]根据所述数据分析报表,确定数据标注过程是否出现异常问题;
[0035]若数据标注过程出现异常问题,则在所述埋点数据库中获取异常问题对应的待分析埋点数据;
[0036]对所述待分析埋点数据进行分析,得到异常原因。
[0037]可选的,所述方法还包括:
[0038]在所述埋点数据库中提取出用户操作行为对应的操作埋点数据,对所述操作埋点数据进行行为分析,得到第一分析结果,所述第一分析结果用于表征用户画像。
[0039]第三方面,本申请实施例提供了一种基于数据标注的埋点装置,所述基于数据标注的埋点装置包括:
[0040]获取模块,用于响应于埋点操作,对数据标注过程进行埋点处理,得到多个目标埋点;
[0041]所述获取模块,还用于获取在所述目标埋点处采集的埋点数据;
[0042]发送模块,用于将所述埋点数据发送给服务器,所述埋点数据用于指示所述服务器根据所述埋点数据确定数据分析报表。
[0043]可选的,所述目标埋点包括第一目标埋点和第二目标埋点,所述第一目标埋点包括用户连续两次操作之间的时间间隔小于或等于预设时间间隔的埋点,所述第二目标埋点包括用户连续两次操作之间的时间间隔大于预设时间间隔的埋点;所述获取模块,具体用于分别获取在所述第一目标埋点处采集的埋点数据和在所述第二目标埋点处采集的埋点数据。
[0044]可选的,所述在所述第一目标埋点处采集的埋点数据的发送频次小于在所述第二目标埋点处采集的埋点数据的发送频次。
[0045]可选的,所述发送模块,具体用于在到达预设时长后,将在所述预设时长内,在所述第一目标埋点处采集的所有埋点数据发送给所述服务器;将在所述第二目标埋点处采集的埋点数据实时发送给所述服务器。
[0046]第四方面,本申请实施例提供了另一种埋点数据处理装置,所述埋点数据处理装置包括:
[0047]接收模块,用于接收终端设备发送的多个埋点数据,所述多个埋点数据为所述终端设备在目标埋点处采集的数据,所述目标埋点为所述终端设备在接收到埋点操作后,对数据标注过程进行埋点处理后得到的;
[0048]存储模块,用于将所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据标注的埋点方法,其特征在于,应用于终端设备,包括:响应于埋点操作,对数据标注过程进行埋点处理,得到多个目标埋点;获取在所述目标埋点处采集的埋点数据;将所述埋点数据发送给服务器,所述埋点数据用于指示所述服务器根据所述埋点数据确定数据分析报表。2.根据权利要求1所述的方法,其特征在于,所述目标埋点包括第一目标埋点和第二目标埋点,所述第一目标埋点包括用户连续两次操作之间的时间间隔小于或等于预设时间间隔的埋点,所述第二目标埋点包括用户连续两次操作之间的时间间隔大于预设时间间隔的埋点;所述获取在所述目标埋点处采集的埋点数据,包括:分别获取在所述第一目标埋点处采集的埋点数据和在所述第二目标埋点处采集的埋点数据。3.根据权利要求2所述的方法,其特征在于,所述在所述第一目标埋点处采集的埋点数据的发送频次小于在所述第二目标埋点处采集的埋点数据的发送频次。4.根据权利要求2或3所述的方法,其特征在于,所述将所述埋点数据发送给服务器,包括:在到达预设时长后,将在所述预设时长内,在所述第一目标埋点处采集的所有埋点数据发送给所述服务器;将在所述第二目标埋点处采集的埋点数据实时发送给所述服务器。5.一种埋点数据处理方法,其特征在于,应用于服务器,包括:接收终端设备发送的多个埋点数据,所述多个埋点数据为所述终端设备在目标埋点处采集的数据,所述目标埋点为所述终端设备在接收到埋点操作后,对数据标注过程进行埋点处理后得到的;将所述多个埋点数据存储在埋点数据库中,所述埋点数据库中包括至少一个预设组件;通过所述埋点数据库中的至少一个预设组件对所述数据库中的埋点数据进行处理,得到所述预设组件对应的数据分析报表。6.根据权利要求5所述的方法,其特征在于,所述将所述多个埋点数据存储在埋点数据库中,包括:对所述多个埋点数据进行预分析处理,得到目标数据;根据所述目标数据对应的埋点内容,将归属于同一个业务的多个目标数据按照对应的采集时刻进行连接,生成至少一个关系链路;将所述至少一个关系链路存储至所述埋点数据库中。7.根据权利要求6所述的方法,其特征在于,对所述多个埋点数据进行预分析处理,得到目标数据,包括:根据待分析内容对所述多个埋点数据进行内容提取,得到目标数据;或,根据待分析内容对从所述多个埋点数据进行内容提取后得到的数据进行再分析,得到目标数据。
8.根据权利要求5或6所述的方法,其特征在于,在将所述多个埋点数据存储在埋点数据库中之前,所述方...

【专利技术属性】
技术研发人员:史明威
申请(专利权)人:亿咖通湖北技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1