数据处理方法、装置和计算机可读存储介质制造方法及图纸

技术编号:24010740 阅读:38 留言:0更新日期:2020-05-02 01:39
本公开涉及一种数据处理方法、装置和计算机可读存储介质,涉及数据处理技术领域。该方法包括:获取用户身份信息的传播过程数据;以传播过程数据中传播用户身份信息的各用户为实体节点,以各用户之间的信息传播关系为关系线段,生成知识图谱;根据传播过程数据,确定各用户具有的信息传播关系的数量;根据信息传播关系的数量对知识图谱中的实体节点进行标注处理。本公开的技术方案能够提高数据处理效率。

Data processing method, device and computer readable storage medium

【技术实现步骤摘要】
数据处理方法、装置和计算机可读存储介质
本公开涉及数据处理
,特别涉及一种数据处理方法、数据处理装置和计算机可读存储介质。
技术介绍
人与人之间通过信息的传播可以形成复杂的关系网络。对关系网络进行分析可以获取大量有用信息。在相关技术中,采用数据库的形式对数据进行关联,并存储关系网络用以分析。
技术实现思路
本公开的专利技术人发现上述相关技术中存在如下问题:对海量的关联数据进行查询的程序复杂、缓慢,且存储形式无法直观反映关联关系,从而造成数据处理效率低下。鉴于此,本公开提出了一种数据处理技术方案,能够提高数据处理的效率。根据本公开的一些实施例,提供了一种数据处理方法,包括:获取用户身份信息的传播过程数据;以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以所述各用户之间的信息传播关系为关系线段,生成知识图谱;根据所述传播过程数据,确定所述各用户具有的信息传播关系的数量;根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理。在一些实施例中,所述的数据处理方法还包括:根据本文档来自技高网...

【技术保护点】
1.一种数据处理方法,包括:/n获取用户身份信息的传播过程数据;/n以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以所述各用户之间的信息传播关系为关系线段,生成知识图谱;/n根据所述传播过程数据,确定所述各用户具有的信息传播关系的数量;/n根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理。/n

【技术特征摘要】
1.一种数据处理方法,包括:
获取用户身份信息的传播过程数据;
以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以所述各用户之间的信息传播关系为关系线段,生成知识图谱;
根据所述传播过程数据,确定所述各用户具有的信息传播关系的数量;
根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理。


2.根据权利要求1所述的数据处理方法,还包括:
根据所述传播过程数据,确定所述各用户之间的信息传播次数;
根据所述信息传播次数对所述知识图谱中的关系线段进行标注处理。


3.根据权利要求1所述的数据处理方法,还包括:
在所述知识图谱中确定所述用户身份信息的传播发起实体节点和传播终止实体节点;
确定所述传播发起实体节点和所述传播终止实体节点之间的最短传播路径;
根据所述最短传播路径中包含的实体节点个数,对所述传播发起实体节点对应的用户进行评估。


4.根据权利要求1所述的数据处理方法,其中,所述生成知识图谱包括:
计算所述传播过程数据的哈希值;
将计算结果划分为多个数据块;
根据所述多个数据块,利用图形数据库生成知识图谱。


5.根据权利要求1所述的数据处理方法,其中,所述根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理包括:
所述信息传播关系的数量越大,相应的实体节点面积越大。


6.根据权利要求2所述的数据处理方法,其中,所述根据所述信息传播次数对所述知识图谱中的关系线段进行标注处理包括:
所述信息传播次数越多,相应的关系线段越粗。


7.根据权利要求1-6任一项所述的数据处理方法,其中,
所述传播过程数据包括发送所述身份信息的用户ID、接收所述身份信息的用户ID,以及所述用户身份信息的ID、来源方式、转发类型、打开时间、转发时间、转发事件ID、微信ID、公司ID、微信昵称中的一项或多项。


8.一种数据处理装置,包括:
获取单元,用于获取用户身份信息的传播过程数据;
生成单元,用于以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以...

【专利技术属性】
技术研发人员:张帅幸锐黎文康
申请(专利权)人:深圳市加推科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1