【技术实现步骤摘要】
标签图数据的生成方法、装置、设备、介质和程序产品
[0001]本申请涉及计算机
,具体涉及一种标签图数据的生成方法、装置、设备、介质和程序产品。
技术介绍
[0002]标签(Tag)是指用于对信息进行分类和组织的关键词或短语,通常被用来描述一篇文章、一张图片、一个视频或者其他类型的内容。标签可以帮助用户更快速地找到相关的内容,也可以提高内容的搜索可见性和发现性。标签可以作为一种重要的信息组织形式,应用于内容推荐、内容搜索以及社交媒体等多种场景中。例如,在社交媒体上,用户可以在上传照片时添加各种标签,从而让更多人能够发现这个照片。
[0003]现有技术中,常会构建标签体系来提高内容的发现和搜索效率。树形结构是构建标签体系的常用方式,树形结构可以表示标签之间的上下级关系。然而,在实际应用中,标签数量级一般比较大,很多标签之间没有明确的边界或者包含关系,树形结构的标签体系不能准确地表示标签和标签之间的关系。
技术实现思路
[0004]本申请实施例提供一种标签图数据的生成方法、装置、设备、介质和程序产品,通过标签图数据存储对象标签,能精准表征对象标签之间的关系,提升处理效率,减少设备开销。
[0005]本申请实施例提供一种标签图数据的生成方法,包括:获取至少一个待处理对象的对象信息,所述对象信息包括所述待处理对象的对象标签以及所述待处理对象的内容信息;对所述至少一个待处理对象的对象标签进行统计处理,得到统计特征;根据所述待处理对象的对象标签与所述待处理对象的内容信息之间的特征差异,调整初 ...
【技术保护点】
【技术特征摘要】
1.一种标签图数据的生成方法,其特征在于,包括:获取至少一个待处理对象的对象信息,所述对象信息包括所述待处理对象的对象标签以及所述待处理对象的内容信息;对所述至少一个待处理对象的所述对象标签进行统计处理,得到统计特征;根据所述待处理对象的对象标签与所述待处理对象的内容信息之间的特征差异,调整初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量;根据任意两个所述对象标签对应的目标标签向量,确定所述任意两个所述对象标签的标签相似度;生成标签图数据,所述标签图数据包括多个节点以及连接在所述节点之间的边,所述节点表征所述对象标签,所述边由所述统计特征以及所述标签相似度确定。2.如权利要求1所述的标签图数据的生成方法,其特征在于,所述根据所述待处理对象的对象标签与所述待处理对象的内容信息之间的特征差异,调整初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量,包括:由所述待处理对象的对象标签以及所述待处理对象的内容信息,分别得到初始标签向量和内容向量;确定所述初始标签向量与所述内容向量之间的特征距离;根据所述特征距离,调整所述初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量。3.如权利要求2所述的标签图数据的生成方法,其特征在于,所述初始标签向量通过如下步骤得到:获取负样本标签,并从所述待处理对象的对象标签中,确定正样本标签;确定所述正样本标签对应的第一向量,以及确定所述负样本标签对应的第二向量;由所述第一向量以及所述第二向量,得到所述初始标签向量。4.如权利要求2所述的标签图数据的生成方法,其特征在于,所述内容向量通过如下步骤得到:从所述待处理对象的对象标签中,确定特征标签;由所述待处理对象的内容信息以及所述特征标签组合得到所述待处理对象的对象特征;对所述对象特征进行编码处理,得到所述内容向量。5.如权利要求2所述的标签图数据的生成方法,其特征在于,所述根据所述特征距离,调整所述初始标签向量,得到所述待处理对象的对象标签对应的目标标签向量,包括:通过预设的损失函数,计算所述特征距离对应的损失值;根据所述损失值,调整所述初始标签向量直至所述预设的损失函数收敛,得到所述待处理对象的对象标签对应的目标标签向量。6.如权利要求1所述的标签图数据的生成方法,其特征在于,所述统计特征包括词频值和共现值,所述对所述至少一个待处理对象的对象标签进行统计处理,得到统计特征,包括:在所述至少一个待处理对象的所述对象标签中,确定同一所述对象标签出现的次数,得到词频值;
在所述至少一个待处理对象的所述对象标签中,确任意两个所述对象标签共同出现在同一所述待处理对象的所述对象标签中的次数,得到共现值。7.如权利要求1所述的标签图数据的生成方法,其特征在于,所述生成标签图数据,包括:由所述统计特征以及所述标签相似度确定所述边的边特征;针对任一所述节点,结合与所述节点关联的所述边的边特征,得到所述节点的节点特征;基于所述边特征以及所述...
【专利技术属性】
技术研发人员:林玻,崔开元,刘毅,辛永佳,王烨鑫,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。