【技术实现步骤摘要】
数据处理方法及装置、计算机可读存储介质、终端
[0001]本专利技术实施例涉及数据处理
,尤其涉及一种数据处理方法及装置、计算机可读存储介质、终端。
技术介绍
[0002]针对生活中的各种事物进行建模、数据处理时,都可以用“图”作为一种表达的范式:事物本身作为“节点”,事物之间的关系则称为“边”,各种各样的“节点”和“边”构成“图”。节点可以是人、公司、设备、商品、文章等等具体的事物,也可以是身份、结论、原因、学派等抽象的概念。连接两个节点的边表明该节点对之间的关系,比如从属、亲属、任职、购买等。图中的每个节点和每条边都可以带有自身的属性。来自真实世界的图往往包含了多种类型的节点和边,称之为“异构图”(Heterogeneous Graph)。有的时候需直接基于庞大芜杂的异构图数据来进行检测、分类、预测等操作,但很多时候要解决关注的问题,仅仅需要对图中的某一类节点进行操作,此时将异构图转化为仅包含该目标节点类别的“同构图”(Homogeneous Graph),可以使数据量大大减小,下游算法的复杂度也会大大降低。 />[0003]目前本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取输入的待处理数据,所述待处理数据包括用于表征所述待处理数据中各节点间关联关系的异构图;根据所述异构图的原生关联关系对目标节点类别下的节点进行分块,得到多个子块;针对各子块中的节点,根据两两节点所共同关联的指定节点类别下的节点的数目,计算两两节点之间的关联紧密度,关联紧密程度用于表征节点间的相似度,所述指定节点类别用于构建所述目标节点类别的同构图的关联关系;基于各子块中各个节点之间的关联紧密度,构建同构子图;对所述同构子图进行拼接,得到所述目标节点类别的同构图;基于所述目标节点类别的同构图进行数据处理。2.如权利要求1所述的数据处理方法,其特征在于,所述根据所述异构图的原生关联关系对所述目标节点类别下的节点进行分块,得到多个子块,包括:按照所述目标节点类别下的各个节点分别与其他节点类别的关联关系,对所述目标节点类别下的各个节点进行分区,得到多个区块,所述其他节点类别指所述异构图中除所述目标节点类别之外的节点类别,不同区块中所述目标节点类别下的各个节点关联的其他节点类别不同;将各个区块分别对应的其他节点类别作为各区块的指定节点类别,针对各个区块,按照所述目标节点类别下的各节点分别关联的所述指定节点类别下的节点的数目,对所述目标节点类别下的各节点进行分块,得到多个子块,不同子块的数值范围不同。3.如权利要求1所述的数据处理方法,其特征在于,所述根据所述异构图的原生关联关系对所述目标节点类别下的节点进行分块,包括:按照所述目标节点类别下的各节点分别关联的所述指定节点类别下的节点的数目,对所述目标节点类别下的各节点进行分块,得到多个子块,不同子块的数值范围不同。4.如权利要求2或3所述的数据处理方法,其特征在于,所述基于各子块中各个节点之间的关联紧密度,构建同构子图,包括:分别针对相邻的子块,基于所述相邻的子块中各个节点之间的关联紧密度,构建相邻的子块的同构子图。5.如权利要求2或3所述的数据处理方法,其特征在于,所述按照所述目标节点类别下的各节点分别关联的所述指定节点类别下的节点的数目,对所述目标节点类别下...
【专利技术属性】
技术研发人员:徐晟尧,王春平,胥奇,王扬,
申请(专利权)人:上海上湖信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。