标签图数据的生成方法、装置、设备、介质和程序产品制造方法及图纸

技术编号:39280394 阅读:8 留言:0更新日期:2023-11-07 10:54
本申请实施例公开了一种标签图数据的生成方法、装置、设备、介质和程序产品,可以应用于人工智能技术领域,如自然语言处理的场景;本申请实施例获取至少一个待处理对象的对象信息;对至少一个待处理对象的对象标签进行统计处理,得到统计特征;根据待处理对象的对象标签与待处理对象的内容信息之间的特征差异,调整初始标签向量,得到待处理对象的对象标签对应的目标标签向量;根据任意两个对象标签对应的目标标签向量,确定任意两个对象标签的标签相似度;生成标签图数据,边由统计特征以及标签相似度确定。在本申请实施例中,通过标签图数据存储对象标签,能精准表征对象标签之间的关系,提升处理效率,减少设备开销。减少设备开销。减少设备开销。

【技术实现步骤摘要】
标签图数据的生成方法、装置、设备、介质和程序产品


[0001]本申请涉及计算机
,具体涉及一种标签图数据的生成方法、装置、设备、介质和程序产品。

技术介绍

[0002]标签(Tag)是指用于对信息进行分类和组织的关键词或短语,通常被用来描述一篇文章、一张图片、一个视频或者其他类型的内容。标签可以帮助用户更快速地找到相关的内容,也可以提高内容的搜索可见性和发现性。标签可以作为一种重要的信息组织形式,应用于内容推荐、内容搜索以及社交媒体等多种场景中。例如,在社交媒体上,用户可以在上传照片时添加各种标签,从而让更多人能够发现这个照片。
[0003]现有技术中,常会构建标签体系来提高内容的发现和搜索效率。树形结构是构建标签体系的常用方式,树形结构可以表示标签之间的上下级关系。然而,在实际应用中,标签数量级一般比较大,很多标签之间没有明确的边界或者包含关系,树形结构的标签体系不能准确地表示标签和标签之间的关系。

技术实现思路

[0004]本申请实施例提供一种标签图数据的生成方法、装置、设备、介质和程序产品,通过标签图数据存储对象标签,能精准表征对象标签之间的关系,提升处理效率,减少设备开销。
[0005]本申请实施例提供一种标签图数据的生成方法,包括:获取至少一个待处理对象的对象信息,所述对象信息包括所述待处理对象的对象标签以及所述待处理对象的内容信息;对所述至少一个待处理对象的对象标签进行统计处理,得到统计特征;根据所述待处理对象的对象标签与所述待处理对象的内容信息之间的特征差异,调整初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量;根据任意两个所述对象标签对应的目标标签向量,确定所述任意两个所述对象标签的标签相似度;生成标签图数据,所述标签图数据包括多个节点以及连接在所述节点之间的边,所述节点表征所述对象标签,所述边由所述统计特征以及所述标签相似度确定。
[0006]本申请实施例还提供一种标签图数据的生成装置,包括:获取单元,用于获取至少一个待处理对象的对象信息,所述对象信息包括所述待处理对象的对象标签以及所述待处理对象的内容信息;统计单元,用于对所述至少一个待处理对象的对象标签进行统计处理,得到统计特征;调整单元,用于根据所述待处理对象的对象标签与所述待处理对象的内容信息之间的特征差异,调整初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量;确定单元,用于根据任意两个所述对象标签对应的目标标签向量,确定所述任意两个所述对象标签的标签相似度;生成单元,用于生成标签图数据,所述标签图数据包括多个节点以及连接在所述节点之间的边,所述节点表征所述对象标签,所述边由所述统计特征以及所述标签相似度确定。
[0007]本申请实施例还提供一种电子设备,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本申请实施例所提供的任一种标签图数据的生成方法中的步骤。
[0008]本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种标签图数据的生成方法中的步骤。
[0009]本申请实施例还提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现本申请实施例所提供的任一种标签图数据的生成方法中的步骤。
[0010]本申请实施例可以获取至少一个待处理对象的对象信息,所述对象信息包括所述待处理对象的对象标签以及所述待处理对象的内容信息;对所述至少一个待处理对象的对象标签进行统计处理,得到统计特征;根据所述待处理对象的对象标签与所述待处理对象的内容信息之间的特征差异,调整初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量;根据任意两个所述对象标签对应的目标标签向量,确定所述任意两个所述对象标签的标签相似度;生成标签图数据,所述标签图数据包括多个节点以及连接在所述节点之间的边,所述节点表征所述对象标签,所述边由所述统计特征以及所述标签相似度确定。
[0011]在本申请中,构建基于图数据的标签体系(即标签图数据),相比树形结构的标签体系,标签图数据通过边表示标签之间的关联度和相似度,可以更准确、灵活地表达标签之间的关系,构建更精准、精细化的标签体系。同时,标签图数据以边和节点的形式更紧凑地表征标签之间的关系,减少了标签的存储空间和存储消耗。
[0012]此外,本申请在构建标签图数据的过程中,基于统计特征以及标签相似度,可以找到与任一节点具有联系度的其他节点,从而构建完整、精确地的标签图数据。其中,将统计特征融入边中,可以增强出现频率更高的节点的关联关系,提升核心标签在标签图数据中的重要性,以提高构建的标签图数据的精准性。此外,通过比较对象标签与内容信息之间的特征差异,加入了待处理对象的内容信息后重新生成目标标签向量,以更好地反映待处理对象的标签特征,由此提升得到的标签相似度的准确性,进一步高构建的标签图数据的精准性。由此,本申请实施例通过标签图数据存储对象标签,能精准表征对象标签之间的关系,以此,在应用于如发现和搜索场景中时,能快速、准确地定位到相关内容,提升处理效率,减少设备开销。
附图说明
[0013]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1a是本申请实施例提供的标签图数据的生成方法的场景示意图;
[0015]图1b是本申请实施例提供的标签图数据的生成方法的流程示意图;
[0016]图1c是本申请实施例提供的剪枝前后的标签图数据的图结构的示意图;
[0017]图2a是本申请实施例提供的标签图数据系统的结构示意图;
[0018]图2b是本申请实施例提供的标签图数据的生成方法的流程示意图;
[0019]图2c是本申请实施例提供的标签向量增量训练模块的训练流程示意图;
[0020]图3a是本申请另一个实施例提供的标签图数据系统的结构示意图;
[0021]图3b是本申请实施例提供的标签图数据的生成方法的流程示意图;
[0022]图4是本申请实施例提供的标签图数据的生成装置的结构示意图;
[0023]图5是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0024]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0025]本申请实施例提供一种标签图数据的生成方法、装置、设备、介质和程序产品。
[0026]其中,该标签图数据的生成装置具体可以集成在电子设备中,该电子设备可以为终端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签图数据的生成方法,其特征在于,包括:获取至少一个待处理对象的对象信息,所述对象信息包括所述待处理对象的对象标签以及所述待处理对象的内容信息;对所述至少一个待处理对象的所述对象标签进行统计处理,得到统计特征;根据所述待处理对象的对象标签与所述待处理对象的内容信息之间的特征差异,调整初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量;根据任意两个所述对象标签对应的目标标签向量,确定所述任意两个所述对象标签的标签相似度;生成标签图数据,所述标签图数据包括多个节点以及连接在所述节点之间的边,所述节点表征所述对象标签,所述边由所述统计特征以及所述标签相似度确定。2.如权利要求1所述的标签图数据的生成方法,其特征在于,所述根据所述待处理对象的对象标签与所述待处理对象的内容信息之间的特征差异,调整初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量,包括:由所述待处理对象的对象标签以及所述待处理对象的内容信息,分别得到初始标签向量和内容向量;确定所述初始标签向量与所述内容向量之间的特征距离;根据所述特征距离,调整所述初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量。3.如权利要求2所述的标签图数据的生成方法,其特征在于,所述初始标签向量通过如下步骤得到:获取负样本标签,并从所述待处理对象的对象标签中,确定正样本标签;确定所述正样本标签对应的第一向量,以及确定所述负样本标签对应的第二向量;由所述第一向量以及所述第二向量,得到所述初始标签向量。4.如权利要求2所述的标签图数据的生成方法,其特征在于,所述内容向量通过如下步骤得到:从所述待处理对象的对象标签中,确定特征标签;由所述待处理对象的内容信息以及所述特征标签组合得到所述待处理对象的对象特征;对所述对象特征进行编码处理,得到所述内容向量。5.如权利要求2所述的标签图数据的生成方法,其特征在于,所述根据所述特征距离,调整所述初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量,包括:通过预设的损失函数,计算所述特征距离对应的损失值;根据所述损失值,调整所述初始标签向量直至所述预设的损失函数收敛,得到所述待处理对象的对象标签对应的目标标签向量。6.如权利要求1所述的标签图数据的生成方法,其特征在于,所述统计特征包括词频值和共现值,所述对所述至少一个待处理对象的对象标签进行统计处理,得到统计特征,包括:在所述至少一个待处理对象的所述对象标签中,确定同一所述对象标签出现的次数,得到词频值;
在所述至少一个待处理对象的所述对象标签中,确任意两个所述对象标签共同出现在同一所述待处理对象的所述对象标签中的次数,得到共现值。7.如权利要求1所述的标签图数据的生成方法,其特征在于,所述生成标签图数据,包括:由所述统计特征以及所述标签相似度确定所述边的边特征;针对任一所述节点,结合与所述节点关联的所述边的边特征,得到所述节点的节点特征;基于所述边特征以及所述...

【专利技术属性】
技术研发人员:林玻崔开元刘毅辛永佳王烨鑫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1