一种因果样本构建方法、服务器及存储介质技术

技术编号:38467808 阅读:13 留言:0更新日期:2023-08-11 14:44
本申请提供一种因果样本构建方法、服务器及存储介质,能够从电子设备采集的设备事件中获取原因事件和结果事件并构建因果样本。该方法中,服务器获取电子设备采集的多个设备事件,并预测时刻。如果从预测时刻开始的第二时长内的第一设备事件为预设触发事件,则服务器从多个设备事件中获取预测时刻前第一时长内电子设备采集的设备事件,得到至少一个原因事件;以及从多个设备事件中获取从预设时刻开始到第一设备事件的事件发生时刻之间的时段内电子设备采集的设备事件,得到至少一个结果事件。然后服务器以至少一个原因事件与至少一个结果事件构建用于训练目标事件预测模型的一个目标因果样本。个目标因果样本。个目标因果样本。

【技术实现步骤摘要】
一种因果样本构建方法、服务器及存储介质


[0001]本申请涉及数据处理
,尤其涉及一种因果样本构建方法、服务器及存储介质。

技术介绍

[0002]用户使用电子设备的过程中,用户行为使得电子设备的窗口内容、网络状态、地理位置、运动状态等发生变化,产生了设备事件,设备事件包括窗口内容变化事件、网络状态变化事件、地理位置变化事件、运动状态变化事件等。上述设备事件之间可能存在因果关系,即一些设备事件可能导致另一些设备事件发生。以用户的地理位置发生变化后,用户执行了付款操作为例,地理位置变化事件会导致窗口内容变化事件发生,该地理位置变化事件为原因事件,该窗口内容变化事件为结果事件,原因事件和结果事件构成了因果样本。从海量设备事件中提取具有因果关系的设备事件构成因果样本,能够用于训练目标事件预测模型。目标事件预测模型基于电子设备上已发生的原因事件预测电子设备上将发生的结果事件,为电子设备侧提供参考,使电子设备侧提供与该结果事件相关的推送服务。而如何构建因果样本是目前亟待解决的问题。

技术实现思路

[0003]本申请提供一种因果样本构建方法、服务器及存储介质,能够从电子设备采集的设备事件中获取原因事件和结果事件并构建因果样本。
[0004]第一方面,本申请提供一种因果样本构建方法,应用于服务器,服务器包括待训练的目标事件预测模型,目标事件预测模型用于基于电子设备上已发生的设备事件预测电子设备上将发生的设备事件,以触发电子设备进行信息推送。设备事件包括电子设备按事件类型划分的窗口内容变化事件、网络状态变化事件、地理位置变化事件以及运动状态变化事件中的至少一种。该方法中,服务器获取电子设备采集的多个设备事件,并获取目标事件预测模型进行推理预测将发生的设备事件的预测时刻。如果从预测时刻开始的第二时长内的第一设备事件为预设触发事件,则服务器从多个设备事件中获取预测时刻前第一时长内电子设备采集的设备事件,得到至少一个原因事件;以及从多个设备事件中获取从预设时刻开始到第一设备事件的事件发生时刻之间的时段内电子设备采集的设备事件,得到至少一个结果事件。然后服务器以至少一个原因事件与至少一个结果事件构建用于训练目标事件预测模型的一个目标因果样本。
[0005]本方案中通过从设备事件中获取原因事件和结果事件构建了目标因果样本。其中原因事件的事件发生时刻和预测时刻之间的时长在第一时长内,结果事件的事件发生时刻和预测时刻之间的时长在第二时长内,通过预测时刻,第一时长和第二时长实现了对发生的太早或太晚的设备事件的过滤,从而控制输出的设备事件的数量,避免查询得到的设备事件太多浪费计算资源。
[0006]其中,上述发生的太早是指设备事件早于预测时刻发生且设备事件的事件发生时
刻和预测时刻之间的时长大于第一时长,上述发生的太晚是指设备事件晚于预测时刻发生且设备事件的事件发生时刻和预测时刻之间的时长大于第二时长。
[0007]在第一方面的另一种可能的设计方式中,上述从多个设备事件中获取预测时刻前第一时长内电子设备采集的设备事件,得到至少一个原因事件,包括:服务器按照多个设备事件的事件发生时刻的先后顺序,依次将多个设备事件插入事件缓存队列。如果事件缓存队列中队尾的设备事件的事件发生时刻与事件缓存队列中队头的设备事件的事件发生时刻之间的差值大于或等于第一时长,则服务器对事件缓存队列中队头的设备事件执行出队操作。如果事件缓存队列中队尾的设备事件的事件发生时刻为预测时刻,则服务器将事件缓存队列中的所有设备事件作为原因事件,得到至少一个原因事件。
[0008]该设计方式下,服务器利用队列先进先出的特点将查询得到的设备事件按时间的先后顺序插入事件缓存队列中,先发生的设备事件先入队也先出队,后发生的设备事件后入队也后出队。所以距离预测时刻前越早发生的设备事件将越早出队,当事件缓存队列中队尾的设备事件的事件发生时刻为预测时刻,服务器已经将发生在预测时刻前且距离预测时刻的时长超过第一时长的设备事件全部剔除。因为剔除的是太早发生所以对模型训练效果起到的作用较小的设备事件,所以获取到的设备事件可作为原因事件。通过事件缓存队列提高了从设备事件中筛选原因事件的效率。
[0009]在第一方面的另一种可能的设计方式中,上述从多个设备事件中获取从预设时刻开始到第一设备事件的事件发生时刻之间的时段内电子设备采集的设备事件,得到至少一个结果事件,包括:服务器按照多个设备事件的事件发生时刻的先后顺序,依次将多个设备事件插入事件缓存队列。如果事件缓存队列中队尾的设备事件为预设触发事件,且队尾的设备事件的事件发生时刻与预测时刻之间的差值小于第二时长,则服务器从事件缓存队列中将事件发生时刻在预测时刻和队尾的设备事件的事件发生时刻之间的设备事件与队尾的设备事件都作为结果事件,得到至少一个结果事件。
[0010]在第一方面的另一种可能的设计方式中,该方法还包括:如果从预测时刻开始的第二时长内的设备事件都不为预测触发事件,则服务器获取从预测时刻开始的第二时长内的电子设备采集的设备事件,得到至少一个结果事件。
[0011]在第一方面的另一种可能的设计方式中,上述如果从预测时刻开始的第二时长内的设备事件都不为预测触发事件,则获取从预测时刻开始的第二时长内的电子设备采集的设备事件,得到至少一个结果事件,包括:服务器按照多个设备事件的事件发生时刻的先后顺序,依次将多个设备事件插入事件缓存队列。如果事件缓存队列中队尾的设备事件的事件发生时刻是结束时刻且队尾的设备事件不为预测触发事件,则服务器从事件缓存队列中将事件发生时刻在预测时刻和队尾的设备事件的事件发生时刻之间的设备事件作为结果事件,得到至少一个结果事件。其中,结束时刻是预测时刻后的时刻且结束时刻与预测时刻之间的差值是第二时长。
[0012]在第一方面的另一种可能的设计方式中,在获取电子设备采集的多个设备事件之前,该方法还包括:服务器获取用于训练事件预测模型的多个因果样本的结构特点信息。其中,每个因果样本包括多个设备事件,每个因果样本的结构特点信息包括:因果样本中的每个设备事件结构化处理后得到多个特征项;多个特征项包括:设备事件的用户标识、设备事件的事件发生时刻以及设备事件的事件内容;其中,事件内容包含至少一个特征数据,且不
同事件类型的设备事件的事件内容中包含的特征数据的数据类型不同。服务器根据因果样本的结构特点信息,设置因果样本的属性;其中,因果样本中,用户标识的属性是字符串,事件发生时刻的属性是时间戳以及事件内容的属性是对象;其中,因果样本的属性用于确定设备事件对应的多个特征项中的每个特征项的存储类型。然后服务器按照设置的因果样本的属性,将电子设备采集的设备事件存储至原始数据表中。其中,原始数据表包括多个字段,多个字段包括用户标识字段、事件发生时刻字段和事件内容字段,用户标识字段用于存储属性是字符串的用户标识,事件发生时刻字段用于存储属性是时间戳的事件发生时刻,事件内容字段用于存储属性是对象的事件内容。
[0013]该设计方式下,服务器将包含多个不同数据类型的特征数据的事件内容本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种因果样本构建方法,其特征在于,应用于服务器,所述服务器包括待训练的目标事件预测模型,所述目标事件预测模型用于基于电子设备上已发生的设备事件预测所述电子设备上将发生的设备事件,以触发所述电子设备进行信息推送,所述设备事件包括所述电子设备按事件类型划分的窗口内容变化事件、网络状态变化事件、地理位置变化事件以及运动状态变化事件中的至少一种;所述方法包括:获取所述电子设备采集的多个设备事件,并获取所述目标事件预测模型进行推理预测将发生的设备事件的预测时刻;如果从所述预测时刻开始的第二时长内的第一设备事件为预设触发事件,则从所述多个设备事件中获取所述预测时刻前第一时长内所述电子设备采集的设备事件,得到至少一个原因事件;以及从所述多个设备事件中获取从所述预设时刻开始到所述第一设备事件的事件发生时刻之间的时段内所述电子设备采集的设备事件,得到至少一个结果事件;以所述至少一个原因事件与所述至少一个结果事件构建用于训练所述目标事件预测模型的一个目标因果样本。2.根据权利要求1所述的方法,其特征在于,所述从所述多个设备事件中获取所述预测时刻前第一时长内所述电子设备采集的设备事件,得到至少一个原因事件,包括:按照所述多个设备事件的事件发生时刻的先后顺序,依次将所述多个设备事件插入事件缓存队列;如果所述事件缓存队列中队尾的设备事件的事件发生时刻与所述事件缓存队列中队头的设备事件的事件发生时刻之间的差值大于或等于第一时长,则对事件缓存队列中队头的设备事件执行出队操作;如果所述事件缓存队列中队尾的设备事件的事件发生时刻为所述预测时刻,则将所述事件缓存队列中的所有设备事件作为原因事件,得到所述至少一个原因事件。3.根据权利要求1或2所述的方法,其特征在于,所述从所述多个设备事件中获取从所述预设时刻开始到所述第一设备事件的事件发生时刻之间的时段内所述电子设备采集的设备事件,得到至少一个结果事件,包括:按照所述多个设备事件的事件发生时刻的先后顺序,依次将所述多个设备事件插入事件缓存队列;如果所述事件缓存队列中队尾的设备事件为所述预设触发事件,且所述队尾的设备事件的事件发生时刻与所述预测时刻之间的差值小于第二时长,则从所述事件缓存队列中将事件发生时刻在所述预测时刻和所述队尾的设备事件的事件发生时刻之间的设备事件与所述队尾的设备事件都作为结果事件,得到所述至少一个结果事件。4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:如果从所述预测时刻开始的第二时长内的设备事件都不为所述预测触发事件,则获取从所述预测时刻开始的所述第二时长内的所述电子设备采集的设备事件,得到所述至少一个结果事件。5.根据权利要求4所述的方法,其特征在于,所述如果从所述预测时刻开始的第二时长内的设备事件都不为所述预测触发事件,则获取从所述预测时刻开始的所述第二时长内的所述电子设备采集的设备事件,得到所述至少一个结果事件,包括:按照所述多个设备事件的事件发生时刻的先后顺序,依次将所述多个设备事件插入事
件缓存队列;如果所述事件缓存队列中队尾的设备事件的事件发生时刻是结束时刻且所述队尾的设备事件不为所述预测触发事件,则从所述事件缓存队列中将事件发生时刻在所述预测时刻和所述队尾的设备事件的事件发生时刻之间的设备事件作为结果事件,得到所述至少一个结果事件;其中,所述结束时刻是所述预测时刻后的时刻且所述结束时刻与所述预测时刻之间的差值是所述第二时长。6.根据权利要求1或2所述的方法,其特征在于,在所述获取所述电子设备采集的多个设备事件之前,所述方法还包括:获取用于训练所述事件预测模型的多个因果样本的结构特点信息;其中,每个所述因果样本包括多个所述设备事件,每个所述因果样本的结构特点信息包括:所述因果样本中的每个所述设备事件结构化处理后得到多个特征项;所述多个特征项包括:所述设备事件的用户标识、所述设备事件的事件发生时刻以及所述设备事件的事件内容;其中,所述事件内容包含至少一个特征数据,且不同事件类型的所述设备事件的所述事件内容中包含的特征数据的数据类型不同;根据所述因果样本的结构特点信息,设置所述因果样本的属性;其中,所述因果样本中,所述用户标识的属性是字符串,所述事件发生时刻的属性是时间戳以及所述事件内容的属性是对象;其中,所述因果样本的属性用于确定所述设备事件对应的所述多个特征项中的每个特征项的存储类型;按照设置的因果样本的属性,将所述电子设备采集的设备事件存储至原始数据表中;其中,所述原始数据表包括多个字段,所述多个字段包括用户标识字段、事件发生时刻字段和事件内容字段,所述用户标识字段用于存储属性是字符串的所述用户标识,所述事件发生时刻字段用于存储...

【专利技术属性】
技术研发人员:张能斌杨威肖福龙孙加恒
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1