一种数据处理方法、系统及存储介质技术方案

技术编号:38467805 阅读:12 留言:0更新日期:2023-08-11 14:44
本申请提供一种数据处理方法、系统及存储介质,能够提高因果样本构建效率。该数据查询方法包括:获取用于训练事件预测模型的多个因果样本的结构特点信息;根据因果样本的结构特点信息,设置因果样本的属性;因果样本中,用户标识的属性是字符串,事件发生时刻的属性是时间戳以及事件内容的属性是对象。因果样本的属性用于确定设备事件对应的多个特征项中的每个特征项的存储类型。个特征项的存储类型。个特征项的存储类型。

【技术实现步骤摘要】
一种数据处理方法、系统及存储介质


[0001]本申请涉及数据处理
,尤其涉及一种数据处理方法、系统及存储介质。

技术介绍

[0002]用户使用电子设备的过程中,用户行为使得电子设备的窗口内容、网络状态、地理位置、运动状态等发生变化,产生了设备事件,设备事件包括窗口内容变化事件、网络状态变化事件、地理位置变化事件、运动状态变化事件等。上述设备事件之间可能存在因果关系,即一些设备事件可能导致另一些设备事件发生。例如,用户进入一个地理围栏后,该用户操作电子设备执行了付款操作;上述进入地理围栏事件引发后续付款事件(即窗口内容变化事件)的发生。该进入地理围栏事件可以称为原因事件,该窗口内容变化事件称为结果事件,原因事件和结果事件构成了因果样本。从海量设备事件中提取具有因果关系的设备事件构成因果样本,能够用于训练事件预测模型。事件预测模型基于电子设备上已发生的设备事件预测电子设备上将发生的设备事件,为电子设备侧提供参考,使电子设备侧提供与该结果相关的推送服务。
[0003]目前,采用通用的数据模型,如结构化查询语言(Structured Query Language,SQL)数据库模型构建设备事件中的各特征的属性,由于不同事件类型的设备事件的事件内容不同,比如窗口内容变化事件包含三个特征来反映窗口内容变化,网络状态变化事件包括五个特征来反映网络状态变化,所以SQL数据库模型将不同事件类型的设备事件分开存储,比如窗口内容变化事件存储于数据表A中,网络状态变化事件存储于数据表B中。这就导致如果一个因果样本中同时涉及查询窗口内容变化事件和网络状态变化事件,则需要跨表查询以及关联计算,导致因果样本的构建效率较低。

技术实现思路

[0004]本申请提供一种数据处理方法、系统及存储介质,能够解决因果样本构建效率低的问题,提高因果样本构建效率。
[0005]第一方面,本申请提供一种数据处理方法,应用于服务器,服务器包括待训练的目标事件预测模型,目标事件预测模型用于基于电子设备上已发生的设备事件预测电子设备上将发生的设备事件以触发电子设备进行信息推送,设备事件包括电子设备按事件类型划分的窗口内容变化事件、网络状态变化事件、地理位置变化事件以及运动状态变化事件中的至少一种。该方法中,服务器获取用于训练事件预测模型的多个因果样本的结构特点信息;其中,每个因果样本包括多个设备事件,每个因果样本的结构特点信息包括:因果样本中的每个设备事件结构化处理后得到多个特征项。多个特征项包括:设备事件的用户标识、设备事件的事件发生时刻以及设备事件的事件内容。其中,事件内容包含至少一个特征数据,且不同事件类型的设备事件的事件内容中包含的特征数据的数据类型不同;根据因果样本的结构特点信息,设置因果样本的属性;其中,因果样本中,用户标识的属性是字符串,事件发生时刻的属性是时间戳以及事件内容的属性是对象;其中,因果
样本的属性用于确定设备事件对应的多个特征项中的每个特征项的存储类型。
[0006]其中,上述待训练的目标事件预测模型也可以是待选型的事件预测算法。
[0007]本方案中,服务器将包含多个不同数据类型的特征数据的事件内容的属性设置为对象,使得事件内容中的各个特征数据被关联。那么在查询事件内容中的多个特征数据时,不必分别查询各个特征数据再对查询结果做关联计算,而是先查询事件内容,再查询事件内容中的各个特征数据。因此在构建包含事件内容的因果样本时,构建效率更高。
[0008]在第一方面的另一种可能的设计方式中,该方法还包括:服务器按照设置的因果样本的属性,将电子设备采集的设备事件存储至原始数据表中,其中,原始数据表包括多个字段,多个字段包括用户标识字段、事件发生时刻字段和事件内容字段,用户标识字段用于存储属性是字符串的用户标识,事件发生时刻字段用于存储属性是时间戳的事件发生时刻,事件内容字段用于存储属性是对象的事件内容。
[0009]该设计方式下,按照设置的因果样本的属性,将电子设备采集的设备事件存储至原始数据表包括:把属性是字符串的用户标识存在用户标识字段里,把属性是时间戳的事件发生时刻存在事件发生时刻字段里,把属性是对象的事件内容存在事件内容字段里。也就是说事件内容中的各个特征数据被存储于同一个字段中,那么在查询时通过查询事件内容字段可查询到事件内容中的所有特征数据,而不必先单独查询各个特征数据再对查询结果做关联计算,因此查询效率更高。查询得到的设备事件能被用于构建用来训练上述待训练目标事件预测模型的目标因果样本,因此构建因果样本的效率更高。
[0010]在第一方面的另一种可能的设计方式中,该方法还包括:服务器获取查询语句,查询语句用于从原始数据表中查询组成目标因果样本的设备事件。若查询语句指示查询事件内容字段中的至少一个特征数据,则服务器先根据事件内容字段查询事件内容,再从事件内容中查询至少一个特征数据,得到包含至少一个特征数据的设备事件。
[0011]该设计方式下,通过将事件内容的属性设为对象实现了在针对事件内容查询时,不必分别查询事件内容中的各个特征数据再做关联计算,而是能先查询所有特征数据,再从所有特征数据中查询某个或某些特征数据,这样查询效率更高。
[0012]在第一方面的另一种可能的设计方式中,在设置因果样本的属性之前,该方法还包括:从每个设备事件中获取描述事件内容的多个特征数据的数据类型。上述事件内容的属性是对象,包括:如果存在任一设备事件中,描述事件内容的多个特征数据中任意两个特征数据的数据类型不同,则服务器以对象作为每个设备事件的事件内容的属性。
[0013]该设计方式下,通过将事件内容的属性设为对象实现了在针对事件内容查询时,不必分别查询事件内容中的各个特征数据再做关联计算,而是能先查询所有特征数据,再从所有特征数据中查询某个或某些特征数据,这样查询效率更高。
[0014]在第一方面的另一种可能的设计方式中,该方法还包括:服务器获取用户标识的数据类型以及事件发生时刻的数据类型。上述用户标识的属性为字符串,包括:服务器根据用户标识的数据类型为字符串,确定用户标识的属性为字符串。上述事件发生时刻的属性为时间戳,包括:服务器根据事件发生时刻的数据类型为时间戳,确定事件发生时刻的属性为时间戳。
[0015]该设计方式下,服务器还获取了用户标识和事件发生时刻这两个特征项的数据类型,由于这两个特征项不包括多个特征数据,所以可提取特征项的数据类型作为该数据项
对应的属性。在存储时,用户标识对应的单个数据被存储于用户标识字段中,且单个数据的数据类型是字符串,那么其属性也是字符串,以及事件发生时刻对应的单个数据被存储于事件发生时刻字段中,且单个数据的数据类型是时间戳。
[0016]在第一方面的另一种可能的设计方式中,事件内容为Wi

Fi状态事件内容,描述Wi

Fi状态事件内容的特征数据包括Wi

Fi名称、Wi

Fi事件类型、Wi

Fi强度和Wi
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,应用于服务器,所述服务器包括待训练的目标事件预测模型,所述目标事件预测模型用于基于电子设备上已发生的设备事件预测所述电子设备上将发生的设备事件以触发所述电子设备进行信息推送,所述设备事件包括所述电子设备按事件类型划分的窗口内容变化事件、网络状态变化事件、地理位置变化事件以及运动状态变化事件中的至少一种;所述方法包括:获取用于训练所述事件预测模型的多个因果样本的结构特点信息;其中,每个所述因果样本包括多个所述设备事件,每个所述因果样本的结构特点信息包括:所述因果样本中的每个所述设备事件结构化处理后得到多个特征项;所述多个特征项包括:所述设备事件的用户标识、所述设备事件的事件发生时刻以及所述设备事件的事件内容;其中,所述事件内容包含至少一个特征数据,且不同事件类型的所述设备事件的所述事件内容中包含的特征数据的数据类型不同;根据所述因果样本的结构特点信息,设置所述因果样本的属性;其中,所述因果样本中,所述用户标识的属性是字符串,所述事件发生时刻的属性是时间戳以及所述事件内容的属性是对象;其中,所述因果样本的属性用于确定所述设备事件对应的所述多个特征项中的每个特征项的存储类型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:按照设置的因果样本的属性,将所述电子设备采集的设备事件存储至原始数据表中;其中,所述原始数据表包括多个字段,所述多个字段包括用户标识字段、事件发生时刻字段和事件内容字段,所述用户标识字段用于存储属性是字符串的所述用户标识,所述事件发生时刻字段用于存储属性是时间戳的所述事件发生时刻,所述事件内容字段用于存储属性是对象的所述事件内容。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取查询语句,所述查询语句用于从所述原始数据表中查询组成目标因果样本的设备事件;若所述查询语句指示查询所述事件内容字段中的至少一个特征数据,则先根据所述事件内容字段查询所述事件内容,再从所述事件内容中查询所述至少一个特征数据,得到包含所述至少一个特征数据的设备事件。4.根据权利要求2所述的方法,其特征在于,在设置所述因果样本的属性之前,所述方法还包括:从每个所述设备事件中获取描述所述事件内容的多个所述特征数据的数据类型;所述事件内容的属性是对象,包括:如果存在任一所述设备事件中,描述所述事件内容的多个所述特征数据中任意两个所述特征数据的数据类型不同,则以所述对象作为每个所述设备事件的事件内容的属性。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述用户标识的数据类型以及所述事件发生时刻的数据类型;所述用户标识的属性为字符串,包括:根据所述用户标识的数据类型为字符串,确定所述用户标识的属性为所述字符串;所述事件发生时刻的属性为时间戳,包括:
根据所述事件发生时刻的数据类型为时间戳,确定所述事件发生时刻的属性为所述时间戳。6.根据权利要求4所述的方法,其特征在于,所述事件内容为Wi

Fi状态事件内容,描述所述Wi

Fi状态事件内容的特征数据包括Wi

Fi名称、Wi

Fi事件类型、Wi

Fi强度和Wi

Fi基础服务集;所述从每个所述设备事件中获取描述所述事件内容的多个所述特征数据的数据类型,包括:获取所述Wi

Fi名称、所述Wi

Fi事件类型、所述Wi

Fi强度和所述Wi

Fi基础服务集的数据类型,得到所述Wi

Fi名称对应的数据类型为时间戳,所述Wi

Fi事件类型对应的数据类型为字符串,所述Wi

Fi强度对应的数据类型...

【专利技术属性】
技术研发人员:张能斌杨威
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1