一种基于主动学习的异构信息网络标签标注方法技术

技术编号:41117066 阅读:28 留言:0更新日期:2024-04-25 14:07
本发明专利技术属于异构信息网络嵌入技术领域,具体涉及一种基于主动学习的异构信息网络标签标注方法;包括:获取异构信息网络文本数据并构建异构信息网络;对网络进行分解,得到多个同构二部子网络;对同构二部子网络进行嵌入处理,得到异构信息网络的节点嵌入表示;所有存在完整标签的节点构成标记节点集,缺失标签的节点构成未标记节点集;根据两种主动选择策略和异构信息网络的节点嵌入表示计算得到实际查询节点集;两种主动选择策略分别为度中心性主动选择策略和接近中心性主动选择策略;根据实际查询节点集更新标记节点集;将标记节点集输入到全连接层进行处理,得到实际查询节点集中节点的标签;本发明专利技术可准确的对异构信息网络的文本数据进行标签标注。

【技术实现步骤摘要】

本专利技术属于异构信息网络嵌入,具体涉及一种基于主动学习的异构信息网络标签标注方法


技术介绍

1、网络嵌入(network embedding,ne),也称为网络表示学习(networkrepresentation learning,nrl),旨在将网络节点表示为低维向量表示。大多数以往的工作将信息网络建模成同构信息网络,同构信息网络只抽取了实际交互系统中的部分信息,没有区分对象及其之间关系的异构性,从而造成不可逆的信息损失。异构信息网络(heterogeneous information networks,hin)由多种类型的节点和边组成,包含了丰富的语义信息,可以实现对真实世界更完整且自然的抽象,因此越来越多的研究人员致力于高效的异构信息网络表示方法的研究,以提高后续机器学习任务的性能。

2、现实世界中,异构信息网络嵌入(heterogeneous information networksembedding,hne)面临着来自丰富结构的挑战,因为异构信息网络包含不同类型的节点和关系,需要针对每种类型进行不同的处理。在对异构信息网络进行分解本文档来自技高网...

【技术保护点】

1.一种基于主动学习的异构信息网络标签标注方法,其特征在于,包括:将待预测的标签部分缺失文本数据输入到训练好的标签标注模型中,得到文本数据的标签标注结果;

2.根据权利要求1所述的一种基于主动学习的异构信息网络标签标注方法,其特征在于,构建异构信息网络的过程包括:异构信息网络文本数据包括四种类型数据,四种类型数据间存在三种关系,四种类型数据包括论文、会议、作者和术语;三种关系包括论文-作者、论文-会议和论文-术语;将四种类型数据作为节点,节点间根据三种关系形成边,生成异构信息网络。

3.根据权利要求1所述的一种基于主动学习的异构信息网络标签标注方法,其特征在于,得...

【技术特征摘要】

1.一种基于主动学习的异构信息网络标签标注方法,其特征在于,包括:将待预测的标签部分缺失文本数据输入到训练好的标签标注模型中,得到文本数据的标签标注结果;

2.根据权利要求1所述的一种基于主动学习的异构信息网络标签标注方法,其特征在于,构建异构信息网络的过程包括:异构信息网络文本数据包括四种类型数据,四种类型数据间存在三种关系,四种类型数据包括论文、会议、作者和术语;三种关系包括论文-作者、论文-会议和论文-术语;将四种类型数据作为节点,节点间根据三种关系形成边,生成异构信息网络。

3.根据权利要求1所述的一种基于主动学习的异构信息网络标签标注方法,其特征在于,得到异构信息网络的节点嵌入表示的过程包括:

4.根据权利要求1所述的一种基于主动学习的异构信息...

【专利技术属性】
技术研发人员:于洪唐瑾萱王烨
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1