标签确定方法、信息推荐方法、装置、设备及存储介质制造方法及图纸

技术编号:37766747 阅读:9 留言:0更新日期:2023-06-06 13:27
本公开实施例公开了标签确定方法、信息推荐方法、装置、设备及存储介质,涉及计算机技术领域。标签确定方法包括:确定待入库的当前信息与预设信息库中的各库内信息的相似度,针对预设相似度阈值集合中的每个预设相似度阈值,从预设信息库中确定当前预设相似度阈值对应的目标库内信息集合,并基于目标库内信息集合中的库内信息的目标多粒度标签,确定当前预设相似度阈值对应的子标签,其中,目标库内信息集合中的库内信息的相似度大于当前预设相似度阈值,根据预设相似度阈值集合中的各预设相似度阈值分别对应的子标签,确定当前信息的多粒度标签。通过采用上述技术方案,可为信息设置多粒度标签,对信息的表征更加精细,自动化程度高且效率高。程度高且效率高。程度高且效率高。

【技术实现步骤摘要】
标签确定方法、信息推荐方法、装置、设备及存储介质


[0001]本公开实施例涉及计算机
,尤其涉及标签确定方法、信息推荐方法、装置、设备及存储介质。

技术介绍

[0002]随着信息技术的快速发展以及互联网的普及,用户能够接触到的信息越来越多,推荐系统的出现可以有效提高用户的信息获取效率。
[0003]目前,推荐系统可以从信息库中筛选合适的信息向用户推荐,信息库中的信息关联有信息标签,信息标签通常基于人工设定。

技术实现思路

[0004]本公开实施例提供了标签确定方法、装置、存储介质及设备,可以优化现有的标签确定方案。
[0005]第一方面,本公开实施例提供了标签确定方法,包括:
[0006]确定待入库的当前信息与预设信息库中的各库内信息的相似度;
[0007]针对预设相似度阈值集合中的每个预设相似度阈值,从所述预设信息库中确定当前预设相似度阈值对应的目标库内信息集合,并基于所述目标库内信息集合中的库内信息的目标多粒度标签,确定所述当前预设相似度阈值对应的子标签,其中,所述预设相似度阈值集合中的预设相似度阈值的数量为至少两个,所述目标库内信息集合中的库内信息的所述相似度大于所述当前预设相似度阈值;
[0008]根据所述预设相似度阈值集合中的各预设相似度阈值分别对应的子标签,确定所述当前信息的多粒度标签。
[0009]第二方面,本公开实施例还提供了信息推荐方法,包括:
[0010]根据候选信息的多粒度标签确定输入数据,其中,所述候选信息包括预设信息库中的信息,所述预设信息库中的信息的多粒度标签基于本公开实施例任一所述的标签确定方法确定;
[0011]将所述输入数据输入至预设信息推荐模型中;
[0012]根据所述预设信息推荐模型的输出,从所述候选信息中确定待推荐的目标信息。
[0013]第三方面,本公开实施例还提供了标签确定装置,包括:
[0014]相似度确定模块,用于确定待入库的当前信息与预设信息库中的各库内信息的相似度;
[0015]子标签确定模块,用于针对预设相似度阈值集合中的每个预设相似度阈值,从所述预设信息库中确定当前预设相似度阈值对应的目标库内信息集合,并基于所述目标库内信息集合中的库内信息的目标多粒度标签,确定所述当前预设相似度阈值对应的子标签,其中,所述预设相似度阈值集合中的预设相似度阈值的数量为至少两个,所述目标库内信息集合中的库内信息的所述相似度大于所述当前预设相似度阈值;
[0016]多粒度标签确定模块,用于根据所述预设相似度阈值集合中的各预设相似度阈值分别对应的子标签,确定所述当前信息的多粒度标签。
[0017]第四方面,本公开实施例还提供了信息推荐装置,包括:
[0018]输入数据确定模块,用于根据候选信息的多粒度标签确定输入数据,其中,所述候选信息包括预设信息库中的信息,所述预设信息库中的信息的多粒度标签基于本公开实施例任一所述的标签确定方法确定;
[0019]数据输入模块,用于将所述输入数据输入至预设信息推荐模型中;
[0020]信息推荐模块,用于根据所述预设信息推荐模型的输出,从所述候选信息中确定待推荐的目标信息。
[0021]第五方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
[0022]一个或多个处理器;
[0023]存储装置,用于存储一个或多个程序,
[0024]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本公开实施例提供的方法。
[0025]第六方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本公开实施例提供的方法。
[0026]本公开实施例提供的标签确定方案,确定待入库的当前信息与预设信息库中的各库内信息的相似度;针对预设相似度阈值集合中的每个预设相似度阈值,从预设信息库中确定当前预设相似度阈值对应的目标库内信息集合,并基于目标库内信息集合中的库内信息的目标多粒度标签,确定当前预设相似度阈值对应的子标签,其中,目标库内信息集合中的库内信息的相似度大于当前预设相似度阈值;根据预设相似度阈值集合中的各预设相似度阈值分别对应的子标签,确定当前信息的多粒度标签。通过采用上述技术方案,可为信息设置多粒度标签,对信息的表征更加精细,针对每个粒度预先设定相应的相似度阈值,以相似度阈值为基准从库内信息的已有多粒度标签中筛选出用于确定当前信息的子标签,再根据子标签生成对应的多粒度标签,该方案自动化程度高且效率高,可减少人工确定标签所带来的偏差,新增信息可以实现在线实时确定标签,且可快速扩展至大规模的标签体系,有利于提升基于该多粒度标签的信息推荐方案的推荐效果。
附图说明
[0027]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
[0028]图1为本公开实施例所提供的一种标签确定方法的流程示意图;
[0029]图2为本公开实施例所提供的一种标签确定方法的流程示意图;
[0030]图3为本公开实施例所提供的一种信息推荐方法的流程示意图;
[0031]图4为本公开实施例所提供的一种标签确定装置的结构示意图;
[0032]图5为本公开实施例所提供的一种信息推荐装置的结构示意图;
[0033]图6为本公开实施例所提供的一种电子设备的结构示意图。
具体实施方式
[0034]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0035]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0036]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0037]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0038]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签确定方法,其特征在于,包括:确定待入库的当前信息与预设信息库中的各库内信息的相似度;针对预设相似度阈值集合中的每个预设相似度阈值,从所述预设信息库中确定当前预设相似度阈值对应的目标库内信息集合,并基于所述目标库内信息集合中的库内信息的目标多粒度标签,确定所述当前预设相似度阈值对应的子标签,其中,所述预设相似度阈值集合中的预设相似度阈值的数量为至少两个,所述目标库内信息集合中的库内信息的所述相似度大于所述当前预设相似度阈值;根据所述预设相似度阈值集合中的各预设相似度阈值分别对应的子标签,确定所述当前信息的多粒度标签。2.根据权利要求1所述的方法,其特征在于,在所述针对预设相似度阈值集合中的每个预设相似度阈值,从所述预设信息库中确定当前预设相似度阈值对应的目标库内信息集合之前,还包括:基于所述相似度从所述预设信息库中筛选预设数量的相似度最高的库内信息,得到初始库内信息集合;其中,所述针对预设相似度阈值集合中的每个预设相似度阈值,从所述预设信息库中确定当前预设相似度阈值对应的目标库内信息集合,包括:针对预设相似度阈值集合中的每个预设相似度阈值,从所述初始库内信息集合中确定当前预设相似度阈值对应的目标库内信息集合。3.根据权利要求1所述的方法,其特征在于,所述基于所述目标库内信息集合中的库内信息的目标多粒度标签,确定所述当前预设相似度阈值对应的子标签,包括:针对所述目标库内信息集合中的库内信息对应的每个多粒度标签,确定当前多粒度标签所属库内信息对应的所述相似度,并对所确定的相似度进行累加,得到所述当前多粒度标签的标签分数;将所述标签分数最高的多粒度标签确定为目标多粒度标签,并根据所述目标多粒度标签确定所述当前预设相似度阈值对应的子标签。4.根据权利要求1所述的方法,其特征在于,还包括:在所述目标库内信息集合为空的情况下,基于所述当前信息的信息标识,确定所述当前预设相似度阈值对应的子标签。5.根据权利要求4所述的方法,其特征在于,所述信息标识为所述当前信息的唯一标识。6.根据权利要求1所述的方法,其特征在于,所述确定待入库的当前信息与预设信息库中的各库内信息的相似度,包括:获取待入库的当前信息对应的当前密集特征;针对预设信息库中的每个库内信息...

【专利技术属性】
技术研发人员:迟禄袁泽寰卢靓妮
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1