【技术实现步骤摘要】
基于图数据库对数据进行处理的方法和装置
[0001]本说明书实施例涉及计算机
,尤其涉及一种基于图数据库对数据进行处理的方法和装置。
技术介绍
[0002]随着计算机技术的发展,机器学习已经应用到各种各样的
,用于分析、预测各种业务数据。例如,在互联网环境中存在多种类型的交互事件,例如,购买事件,点击事件,支付事件,等等。在许多场景下,需要对各种交互事件进行分析和处理,从而进行业务预测,例如可以根据交互事件历史评估用户操作行为的风险程度,以便进行风险防控;或者,可以根据历史事件评估用户的偏好,从而更好地为用户提供个性化的服务。
[0003]在基于交互事件进行业务预测的场景中,常常会需要利用累积指标,来刻画交互主体的特点。例如,在商户风控场景下,商户主体在交互用户、交互地点、交互商品类目等不同维度的累积指标,尤其是去重复后的累积指标,是刻画商户风险非常重要的特征。相较于非去重复的简单累加值,去重后的累积统计值能够排除单个用户多次交互的影响,具有更好的稳定性。
[0004]因此,希望能有改进的方案,更 ...
【技术保护点】
【技术特征摘要】
1.一种基于图数据库对数据进行处理的方法,包括:获取交互事件数据,其中包括,交互主体的主体标识,交互时间,以及与待累积统计的目标指标对应的若干交互对象标识;从图数据库中读取交互图和所述主体标识针对所述目标指标的目标统计记录,在所述交互图中,存在交互历史的交互主体与交互对象之间以边相连,对应的边属性包括最近交互时间;所述目标统计记录包括与多个时间周期分别对应的多条记录项,单条记录项包括,以对应时间周期为起点,向前回溯预定数目N个时间周期的各时间周期中所述目标指标的各累积值;针对所述若干交互对象标识中的各交互对象标识,对所述图数据库执行更新操作,所述更新操作包括:在所述目标统计记录中确定出与所述交互时间对应的目标记录项;根据所述交互图中所述主体标识和该交互对象标识之间的边属性,对所述目标记录项进行去重更新。2.根据权利要求1所述的方法,其中,所述获取交互事件数据,包括:获取单个交互事件对应的事件数据,作为所述交互事件数据。3.根据权利要求1所述的方法,其中,所述获取交互事件数据,包括:将流式产生的交互事件对应的事件数据发送至流式计算引擎,所述流式计算引擎按照预设时间间隔,根据主体标识对流入的事件数据进行聚合,得到至少一个聚合结果;从所述流式计算引擎中获取各聚合结果作为交互事件数据。4.根据权利要求1所述的方法,其中,所述在所述目标统计记录中确定出与所述交互时间对应的目标记录项,包括:确定所述目标统计记录中是否存在起点的时间周期包含所述交互时间的记录项;如果存在,将存在的记录项确定为目标记录项;如果不存在,在所述目标统计记录中新增一条记录项作为目标记录项,其中,新增的记录项用于记录,以所述交互时间对应的时间周期为起点,向前回溯N个时间周期的各时间周期中所述目标指标的各累积值。5.根据权利要求4所述的方法,其中,所述在所述目标统计记录中新增一条记录项作为目标记录项,包括:生成有待填充的新建记录项;在所述新建记录项中,将起点的时间周期对应的累积值初始化为0;在所述新建记录项之前已存在的最新记录项中,确定出前N个时间周期对应的N个累积值,将其复制到所述新建记录项中,得到所述目标记录项。6.根据权利要求1所述的方法,所述根据所述交互图中所述主体标识和该交互对象标识之间的边属性,对所述目标记录项进行去重更新,包括:将所述目标记录项的起点时间周期对应的累积值加1;确定所述交互图中是否存在所述主体标识和该交互对象标识的边;如果边存在,将边属性包括的最近交互时间对应的时间周期中的累积值减1,并将边属性的最近交互时间更新为所述交互时间;如果边不存在,在所述交互图中添加所述主体标识和该交互对象标识之间形成的边,其中,该添加的边的边属性包括所述交互时间。
7.根据权利要求1所述的方法,其中,所述更新操作还包括:确定去重更新后的统计记录中包括的记录项的条数是否超过最大条数阈值,如果超过,删除更新后的统计记录中起点的时间周期最早的一条记录项。8.根据权利要求1所述的方法,其中,所述方法还包括:响应于确定...
【专利技术属性】
技术研发人员:于仰泉,游荡,孙伟嘉,尹华彬,黄海,朱冠胤,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。