\u672c\u53d1\u660e\u516c\u5f00\u4e86\u4e00\u79cd\u57fa\u4e8e\u4e8c\u90e8\u56fe\u7684\u6807\u7b7e\u4f20\u64ad\u65b9\u6cd5\uff0c\u5c5e\u4e8e\u6807\u7b7e\u4f20\u64ad\u6280\u672f\u9886\u57df\uff0c\u89e3\u51b3\u57fa\u4e8e\u5173\u8054\u7f51\u7edc\u7684\u6807\u7b7e\u4f20\u64ad\u65b9\u6cd5\u8ba1\u7b97\u91cf\u5927\u3001\u8ba1\u7b97\u6548\u7387\u4f4e\u3001\u540c\u8d28\u7f51\u7edc\u8fde\u8fb9\u6570\u91cf\u591a\uff0c\u53ef\u89c6\u5316\u6548\u679c\u5dee\u7684\u95ee\u9898\u3002 The invention preprocesses the collected data, preprocesses the collected data, obtains the object field, association field and label field in the data, establishes a bipartite graph G by using the object field and association field in the data, determines the initial label value of the object node based on the label field, first propagates from top to bottom, then propagates from bottom to top, and obtains each section. If the new label value of a point is greater than the threshold of a given label, it belongs to the same category or/or label value as the node of a known label. The invention is used for label propagation.
【技术实现步骤摘要】
基于二部图的标签传播方法
一种基于二部图的标签传播方法,用于标签传播,属于标签传播
技术介绍
关键术语定义如下:关联网络:由节点和边构成的网状结构,节点表示一个对象,对象和对象之间存在一定的关系则可以形成一条连边。同构网络/异构网络:网络中所有节点都是同一种类型的网络称为同构网络,否则为异构网络。二部图:一种特殊的异构网络结构,该网络结构中存在两种类型的节点,相同类型的节点没有连边,每条连边的两个节点属于不同的节点类型。传统的标签传播方法具体如下:LPA算法的技术方案:1.对收集的数据预处理后,建立同构网络;2.选择相似度计算方式,计算同构网络节点两两之间的相似度,构建相似度矩阵。wij表示节点i和节点j的相似度,常用的计算节点相似度的方法如下:1)高斯径向基(如公式1)其中σ为超参数,且其设置对结果的影响较大;2)K近邻(如公式2)其中Ni表示i的所有K近邻节点,需要计算i与所有其它节点的距离并排序取出钱K个。公式(2)中的wij与公式(1)的wij为两个独立的计算方式,后续计算依据其中一个,或采用其它相似度计算方式都可。相似度矩阵的示例如下:将该相似度矩阵图形化后形成网络结构,如图1所示:3.按公式(3)对相似度标准化,形成转移矩阵P;转移矩阵的示例如下:4.构建标签矩阵F’=PF。FL表示已知标签的节点,为lij为1表示节点i属于类别Cj,否则表示不属于;FU表示未知标签的节点,全部预置为0。FL和FU共同构成标签矩阵F,如下所示:标签矩阵F的示例如下:表示节点A、C属于类别C1,节点B属于类别C2,节点C和节点D的标签未知,需要通过标签传 ...
【技术保护点】
1.一种基于二部图的标签传播方法,其特征在于,如下步骤:S1、对收集的数据进行预处理,得到数据的字段为对象字段、关联字段和标签字段;S2、使用对象字段和关联字段,建立二部图G,建立的二部图包括对象节点和关联属性节点,对象节点为上层节点,关联属性节点为下层节点;S3、基于标签字段,确定对象节点的初始标签值;S4、确定初始标签值后,先从上至下进行传播,再从下至上进行传播,得到每个节点的新标签值,完成一轮传播,若需要二度关联或者三度关联的对象节点对标签值的相互影响,进行第二轮或者第三轮的传播,否则,则得到最终的每个节点的标签值;S5、判断未知标签的对象节点的标签值是否大于设定的对应某已知标签的阈值,若大于,则与已知标签的节点属于同一类别或/和标签值。
【技术特征摘要】
1.一种基于二部图的标签传播方法,其特征在于,如下步骤:S1、对收集的数据进行预处理,得到数据的字段为对象字段、关联字段和标签字段;S2、使用对象字段和关联字段,建立二部图G,建立的二部图包括对象节点和关联属性节点,对象节点为上层节点,关联属性节点为下层节点;S3、基于标签字段,确定对象节点的初始标签值;S4、确定初始标签值后,先从上至下进行传播,再从下至上进行传播,得到每个节点的新标签值,完成一轮传播,若需要二度关联或者三度关联的对象节点对标签值的相互影响,进行第二轮或者第三轮的传播,否则,则得到最终的每个节点的标签值;S5、判断未知标签的对象节点的标签值是否大于设定的对应某已知标签的阈值,若大于,则与已知标签的节点属于同一类别或/和标签值。2.根据权利要求1所述的一种基于二部图的标签传播方法,其特征在于,所述步骤S1的具体步骤为:S1.1、对数据进行包括缺失填补、标准化、错误更正操作,保证数据的正确性和完整性;S2.1、经步骤S1.1处理后,再对数据进行结构化,即根据应用场景将数据的字段分为三类,一类是对象字段,对应的值为对象节点;一类是标签字段,用于定义对象字段的标签值,一类是关联字段,对应的值为关联属性节点,用于描述对象和对象之间的关联关系。3.根据权利要求1或2所述的一种基于二部图的标签传播方法,其特征在于,所述步骤S3中确定对象节点的初始标签值是将已知标签的对象节点用1表示,否则用0表示。4.根据权利要求3所述的一种基于二部图的标签传播方法,其特征在于,所述步骤S4的具体步骤为:S4.1、基于初始的标签值和从上至下进行传播得到的各关联属性节点的标签值...
【专利技术属性】
技术研发人员:李辉,肖羊,韩晗,
申请(专利权)人:四川新网银行股份有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。