数据处理方法、装置和计算机可读存储介质制造方法及图纸

技术编号:24010740 阅读:23 留言:0更新日期:2020-05-02 01:39
本公开涉及一种数据处理方法、装置和计算机可读存储介质,涉及数据处理技术领域。该方法包括:获取用户身份信息的传播过程数据;以传播过程数据中传播用户身份信息的各用户为实体节点,以各用户之间的信息传播关系为关系线段,生成知识图谱;根据传播过程数据,确定各用户具有的信息传播关系的数量;根据信息传播关系的数量对知识图谱中的实体节点进行标注处理。本公开的技术方案能够提高数据处理效率。

Data processing method, device and computer readable storage medium

【技术实现步骤摘要】
数据处理方法、装置和计算机可读存储介质
本公开涉及数据处理
,特别涉及一种数据处理方法、数据处理装置和计算机可读存储介质。
技术介绍
人与人之间通过信息的传播可以形成复杂的关系网络。对关系网络进行分析可以获取大量有用信息。在相关技术中,采用数据库的形式对数据进行关联,并存储关系网络用以分析。
技术实现思路
本公开的专利技术人发现上述相关技术中存在如下问题:对海量的关联数据进行查询的程序复杂、缓慢,且存储形式无法直观反映关联关系,从而造成数据处理效率低下。鉴于此,本公开提出了一种数据处理技术方案,能够提高数据处理的效率。根据本公开的一些实施例,提供了一种数据处理方法,包括:获取用户身份信息的传播过程数据;以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以所述各用户之间的信息传播关系为关系线段,生成知识图谱;根据所述传播过程数据,确定所述各用户具有的信息传播关系的数量;根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理。在一些实施例中,所述的数据处理方法还包括:根据所述传播过程数据,确定所述各用户之间的信息传播次数;根据所述信息传播次数对所述知识图谱中的关系线段进行标注处理。在一些实施例中,所述的数据处理方法还包括:在所述知识图谱中确定所述用户身份信息的传播发起实体节点和传播终止实体节点;确定所述传播发起实体节点和所述传播终止实体节点之间的最短传播路径;根据所述最短传播路径中包含的实体节点个数,对所述传播发起实体节点对应的用户进行评估。在一些实施例中,计算所述传播过程数据的哈希值;将计算结果划分为多个数据块;根据所述多个数据块,利用图形数据库生成知识图谱。在一些实施例中,所述信息传播关系的数量越大,相应的实体节点面积越大。在一些实施例中,所述信息传播次数越多,相应的关系线段越粗。在一些实施例中,所述传播过程数据包括发送所述身份信息的用户ID、接收所述身份信息的用户ID,以及所述用户身份信息的ID、来源方式、转发类型、打开时间、转发时间、转发事件ID、微信ID、公司ID、微信昵称中的一项或多项。根据本公开的另一些实施例,提供一种数据处理装置,包括:获取单元,用于获取用户身份信息的传播过程数据;生成单元,用于以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以所述各用户之间的信息传播关系为关系线段,生成知识图谱;确定单元,用于根据所述传播过程数据,确定所述各用户具有的信息传播关系的数量;标注单元,用于根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理。在一些实施例中,所述确定单元根据所述传播过程数据,确定所述各用户之间的信息传播次数;所述标注单元根据所述信息传播次数对所述知识图谱中的关系线段进行标注处理。在一些实施例中,所述确定单元在所述知识图谱中确定所述用户身份信息的传播发起实体节点和传播终止实体节点,并确定所述传播发起实体节点和所述传播终止实体节点之间的最短传播路径。在一些实施例中,所述数据处理装置还包括:评估单元,用于根据所述最短传播路径中包含的实体节点个数,对所述传播发起实体节点对应的用户进行评估。在一些实施例中,所述生成单元计算所述传播过程数据的哈希值,将计算结果划分为多个数据块,根据所述多个数据块,利用图形数据库生成知识图谱。在一些实施例中,所述信息传播关系的数量越大,所述标注单元将相应的实体节点面积标注的越大。在一些实施例中,所述信息传播次数越多,所述标注单元将相应的关系线段标注的越粗。在一些实施例中,所述传播过程数据包括发送所述身份信息的用户ID、接收所述身份信息的用户ID,以及所述用户身份信息的ID、来源方式、转发类型、打开时间、转发时间、转发事件ID、微信ID、公司ID、微信昵称中的一项或多项。根据本公开的又一些实施例,提供一种数据处理装置,包括:存储器;和耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行上述任一个实施例中的数据处理方法。根据本公开的再一些实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的数据处理方法。在上述实施例中,根据信息的传播过程生成知识图谱,并对知识图谱中参与传播较多的实体节点进行标注。这样,可以直观地表现用户之间的信息传播过程,快速地对参与传播的用户进行分析,从而提高了数据处理效率。附图说明构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:图1示出本公开的数据处理方法的一些实施例的流程图;图2示出图1的步骤120的一些实施例的流程图;图3示出本公开的数据处理方法的另一些实施例的流程图;图4示出本公开的数据处理方法的一些实施例的示意图;图5示出本公开的数据处理方法的又一些实施例的流程图;图6示出本公开的数据处理装置的一些实施例的框图;图7示出本公开的数据处理装置的另一些实施例的框图;图8示出本公开的数据处理装置的又一些实施例的框图。具体实施方式现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。图1示出本公开的数据处理方法的一些实施例的流程图。如图1所示,该方法包括:步骤110,获取传播过程数据;步骤120,生成知识图谱;步骤130,确定信息传播关系数量;和步骤140,对实体节点进行标注。在步骤110中,获取用户身份信息的传播过程数据。用户身份信息例如可以为用户的电子名片,传播过程可以包含多次转发事件。例如用户A将其电子名片转发给用户B,用户B又将电子名片转发给用户C。传播过程数据例如可以包括发送身份信息的用户ID(from_id)、接收身份信息的用户ID(to_id)。传播过程数据还可以包括用户身份信息的ID(card_id)、来源方式(source_type)、转发类型(trans_type)、打开时间(open_time)、转发时间(tran本文档来自技高网...

【技术保护点】
1.一种数据处理方法,包括:/n获取用户身份信息的传播过程数据;/n以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以所述各用户之间的信息传播关系为关系线段,生成知识图谱;/n根据所述传播过程数据,确定所述各用户具有的信息传播关系的数量;/n根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理。/n

【技术特征摘要】
1.一种数据处理方法,包括:
获取用户身份信息的传播过程数据;
以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以所述各用户之间的信息传播关系为关系线段,生成知识图谱;
根据所述传播过程数据,确定所述各用户具有的信息传播关系的数量;
根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理。


2.根据权利要求1所述的数据处理方法,还包括:
根据所述传播过程数据,确定所述各用户之间的信息传播次数;
根据所述信息传播次数对所述知识图谱中的关系线段进行标注处理。


3.根据权利要求1所述的数据处理方法,还包括:
在所述知识图谱中确定所述用户身份信息的传播发起实体节点和传播终止实体节点;
确定所述传播发起实体节点和所述传播终止实体节点之间的最短传播路径;
根据所述最短传播路径中包含的实体节点个数,对所述传播发起实体节点对应的用户进行评估。


4.根据权利要求1所述的数据处理方法,其中,所述生成知识图谱包括:
计算所述传播过程数据的哈希值;
将计算结果划分为多个数据块;
根据所述多个数据块,利用图形数据库生成知识图谱。


5.根据权利要求1所述的数据处理方法,其中,所述根据所述信息传播关系的数量对所述知识图谱中的实体节点进行标注处理包括:
所述信息传播关系的数量越大,相应的实体节点面积越大。


6.根据权利要求2所述的数据处理方法,其中,所述根据所述信息传播次数对所述知识图谱中的关系线段进行标注处理包括:
所述信息传播次数越多,相应的关系线段越粗。


7.根据权利要求1-6任一项所述的数据处理方法,其中,
所述传播过程数据包括发送所述身份信息的用户ID、接收所述身份信息的用户ID,以及所述用户身份信息的ID、来源方式、转发类型、打开时间、转发时间、转发事件ID、微信ID、公司ID、微信昵称中的一项或多项。


8.一种数据处理装置,包括:
获取单元,用于获取用户身份信息的传播过程数据;
生成单元,用于以所述传播过程数据中传播所述用户身份信息的各用户为实体节点,以...

【专利技术属性】
技术研发人员:张帅幸锐黎文康
申请(专利权)人:深圳市加推科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1