【技术实现步骤摘要】
用户行为数据处理方法、装置、电子设备及可读介质
本公开涉及计算机信息处理领域,具体而言,涉及一种用户行为数据处理方法、装置、电子设备及计算机可读介质。
技术介绍
在现有技术中,对大数据的处理上面,经常会利用关系网络的方式对用户的行为信息进行分析,识别出欺诈信息或其他平台感兴趣的信息。现有的关系网络主要借助于图数据库进行数据处理,并且使用图数据库提供的算法进行图计算。图主要由节点(Node)和节点之间的关系(relationship)也就是边组成,现有技术中图数据库分为两种:1)Nativegraphstorage,本地存储图数据,这种设计是从每一个角度对节点和边数据的写入和查询进行优化,确保相关联的节点和边在物理上是接近的,可以进行高速访问。但是由于是本地储存数据,不同区域的开发人员对用户行为数据访问十分不便捷,不利于对用户行为数据进行实时分析。2)Non-nativegraphstorage,依赖于外部存储引擎,可以是关系型、columnar或者NoSQL例如MongoDB。由于这些外部存储引擎并没有针对图 ...
【技术保护点】
1.一种用户行为数据处理方法,其特征在于,包括:/n通过配置信息由用户行为数据中提取第一节点和第一边;/n通过所述第一节点和所述第一边构建图对象;/n对所述图对象进行图划分处理,以生成多个子图;以及/n基于所述多个子图对所述用户行为数据进行分析。/n
【技术特征摘要】
1.一种用户行为数据处理方法,其特征在于,包括:
通过配置信息由用户行为数据中提取第一节点和第一边;
通过所述第一节点和所述第一边构建图对象;
对所述图对象进行图划分处理,以生成多个子图;以及
基于所述多个子图对所述用户行为数据进行分析。
2.如权利要求1所述的方法,其特征在于,还包括:
将所述多个子图储存在分布式数据库中;
其中,将所述多个子图中的第一节点的节点值作为所述分布式数据库的行键值;和/或将所述多个子图中的第一边的边值作为所述分布式数据库的行键值。
3.如权利要求2所述的方法,其特征在于,将所述多个子图储存在分布式数据库中包括:
确定所述多个子图中每一个子图的标识;
确定所述多个子图中每一个子图的第一节点集合;
确定所述多个子图中每一个子图的第一边集合;以及
将子图的标识与第一节点集合、第一边集合进行关联储存。
4.如权利要求2所述的方法,其特征在于,还包括:
将所述行键值进行信息加密后储存。
5.如权利要求1所述的方法,其特征在于,还包括:
将实时的用户行为数据合并入所述多个子图中。
6.如权利要求5所述的方法,其特征在于,将实时的用户行为数据合并入所述多个子图中包括:
由实时的用户行为数据中提取第二节点和第二边;
将第二节点与子图中的第一节点进行比对;以及
在比对结果一致时,将第二节点和第二边合并到子图中。
7.如权利要求6所述的方法,其特征在于,还包括:
在比对结果不一致时,通过所述第二节点与所述第二边构建子图。
8.如权利要求6所述的方法,其特征在于,由实时的用户行为数据中提取第二节点和第二边包括:
解析所述实时的用户行为数据,生成目标字符串;以及
通过所述目标字符串提取所述第二节点和第二边。
9.如权利要求1所述的方法,其特征在于,通过配置信息...
【专利技术属性】
技术研发人员:周石磊,
申请(专利权)人:北京京东金融科技控股有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。