【技术实现步骤摘要】
本专利技术属于异构信息网络嵌入,具体涉及一种基于主动学习的异构信息网络标签标注方法。
技术介绍
1、网络嵌入(network embedding,ne),也称为网络表示学习(networkrepresentation learning,nrl),旨在将网络节点表示为低维向量表示。大多数以往的工作将信息网络建模成同构信息网络,同构信息网络只抽取了实际交互系统中的部分信息,没有区分对象及其之间关系的异构性,从而造成不可逆的信息损失。异构信息网络(heterogeneous information networks,hin)由多种类型的节点和边组成,包含了丰富的语义信息,可以实现对真实世界更完整且自然的抽象,因此越来越多的研究人员致力于高效的异构信息网络表示方法的研究,以提高后续机器学习任务的性能。
2、现实世界中,异构信息网络嵌入(heterogeneous information networksembedding,hne)面临着来自丰富结构的挑战,因为异构信息网络包含不同类型的节点和关系,需要针对每种类型进行不同的处理。在对
...【技术保护点】
1.一种基于主动学习的异构信息网络标签标注方法,其特征在于,包括:将待预测的标签部分缺失文本数据输入到训练好的标签标注模型中,得到文本数据的标签标注结果;
2.根据权利要求1所述的一种基于主动学习的异构信息网络标签标注方法,其特征在于,构建异构信息网络的过程包括:异构信息网络文本数据包括四种类型数据,四种类型数据间存在三种关系,四种类型数据包括论文、会议、作者和术语;三种关系包括论文-作者、论文-会议和论文-术语;将四种类型数据作为节点,节点间根据三种关系形成边,生成异构信息网络。
3.根据权利要求1所述的一种基于主动学习的异构信息网络标签标注
...【技术特征摘要】
1.一种基于主动学习的异构信息网络标签标注方法,其特征在于,包括:将待预测的标签部分缺失文本数据输入到训练好的标签标注模型中,得到文本数据的标签标注结果;
2.根据权利要求1所述的一种基于主动学习的异构信息网络标签标注方法,其特征在于,构建异构信息网络的过程包括:异构信息网络文本数据包括四种类型数据,四种类型数据间存在三种关系,四种类型数据包括论文、会议、作者和术语;三种关系包括论文-作者、论文-会议和论文-术语;将四种类型数据作为节点,节点间根据三种关系形成边,生成异构信息网络。
3.根据权利要求1所述的一种基于主动学习的异构信息网络标签标注方法,其特征在于,得到异构信息网络的节点嵌入表示的过程包括:
4.根据权利要求1所述的一种基于主动学习的异构信息...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。