基于图数据的行为分析方法、装置、电子设备和存储介质制造方法及图纸

技术编号:30168424 阅读:25 留言:0更新日期:2021-09-25 15:25
本发明专利技术公开了一种基于图数据的行为分析方法、装置、电子设备和存储介质,其中,该方法包括:获取图数据集中目标用户的行为增量数据;将所述行为增量数据拆分为实体数据、关系数据以及实体关联关系数据;统计所述实体数据、所述关系数据和所述实体关联关系数据的可视化信息,其中,可视化信息至少包括实体名称、业务关系以及实体关系标识;基于所述可视化信息进行可视化展示。本发明专利技术实施例通过使用增量数据进行可视化展示,可提高用户行为分析的实时性,将增强数据拆分为实体和关系,降低数据规模大导致的统计难度,可提高用户行为分析的准确性。准确性。准确性。

【技术实现步骤摘要】
基于图数据的行为分析方法、装置、电子设备和存储介质


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种基于图数据的行为分析方法、装置、电子设备和存储介质。

技术介绍

[0002]随着数字互联时代的到来,海量数据逐渐充斥着社会生活的方方面面,用户的生活逐渐与数字系统的各种实体产生关联信息,用户的海量数据可以在不同领域以不同的形式存在,例如,用户网页浏览信息、用户沟通会话记录以及用户网约车行动轨迹等,为了向用户提供更优质的定制化服务,往往需要对不同用户不同领域的海量数据进行分析,从而定制合适的服务规则。这些跨领域跨服务商的海量数据往往杂乱无章且不便处理。
[0003]现有的数据解决方案往往只将海量数据存储为图数据,处理仅包括图数据的搜索呈现展示,数据分析过程中对于增量数据与历史数据的融合较少,无法对用户的实时行为进行分析,导致服务质量过低。此外,由于图数据涉及的增量数据规模往往可以达到亿级别,导致用户行为分析存在困难。

技术实现思路

[0004]本专利技术提供一种基于图数据的行为分析方法、装置、电子设备和存储介质本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图数据的行为分析方法,其特征在于,所述方法包括:获取图数据集中目标用户的行为增量数据;将所述行为增量数据拆分为实体数据、关系数据以及实体关联关系数据;统计所述实体数据、所述关系数据和所述实体关联关系数据的可视化信息,其中,可视化信息至少包括实体名称、业务关系以及实体关系标识;基于所述可视化信息进行可视化展示。2.根据权利要求1所述的方法,其特征在于,所述获取图数据集中目标用户的行为增量数据,包括:在Hadoop分布式文件系统中获取所述目标用户产生的行为增量数据;其中,所述行为增量数据包括经过子图拆解的子图信息,其中,子图信息包括实体数据和关系数据。3.根据权利要求1所述的方法,其特征在于,所述将所述行为增量数据拆分为实体数据、关系数据以及实体关联关系数据,包括:基于历史行为数据对所述行为增量数据进行去重;根据用户配置规则确定所述行为增量数据中的删除实体和删除关系;根据所述删除实体和所述删除关系清理所述行为增量数据;基于连通子图计算规则确定所述行为增量数据的孤立点子图和非孤立点子图;确定所述孤立点子图和所述非孤立点子图对应的全量图,并确定所述全量图中点与所属子图的对应关系以及所述全量图中边与所属子图的对应关系。4.根据权利要求3所述的方法,其特征在于,所述根据用户配置规则确定所述行为增量数据中的删除实体和删除关系,包括:确定所述行为增量数据中各实体对应的关系数量;判断各所述关系数量是否所述用户配置规则中的关系数量阈值,若不满足则将对应的所述实体确定为删除实体,若满足则将对应的所述实体确定为保留实体;在所述行为增量数据将各所述删除实体对应的关联关系作为删除关系。5.根据权利要求3所述的方法,其特征在于,所述确定所述孤立点子图和所述非孤立点子图对应的全量图,包括:将所述孤立点子图以及所述非孤...

【专利技术属性】
技术研发人员:吕志军熊忠全
申请(专利权)人:智器云南京信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1