用于优化标签库的方法、装置、电子设备和介质制造方法及图纸

技术编号:24206093 阅读:21 留言:0更新日期:2020-05-20 14:43
本公开提供了一种用于优化标签库的方法,包括获得标签库,所述标签库包括多个用于反映对象的特征的标签,确定多个所述标签中的每个标签的数据价值和业务价值,其中,所述数据价值基于生成所述标签的数据表确定,所述业务价值基于所述标签的历史访问数据确定,基于所述数据价值和业务价值,确定所述标签的综合价值,以及基于所述综合价值,从所述标签库中移除部分标签,得到目标标签库。本公开提供了一种电子设备、一种用于优化标签库的装置以及一种计算机可读存储介质。

Methods, devices, electronics, and media for optimizing the label Library

【技术实现步骤摘要】
用于优化标签库的方法、装置、电子设备和介质
本公开涉及一种用于优化标签库的方法、装置、电子设备和介质。
技术介绍
当前用户画像领域将更多的眼光专注在从深度和广度上扩展标签体系,因此用户画像系统的标签数量每月以较快的速度增加。业务对于标签的需求也各有见解,不断有新标签需求接踵而至。随着时间推移,业务的重点的调整,有些标签价值在慢慢减弱。如此,造成标签库变得越来越臃肿,有价值的标签得不到更好地利用。
技术实现思路
本公开的一个方面提供了一种用于优化标签库的方法,包括获得标签库,所述标签库包括多个用于反映对象的特征的标签,确定多个所述标签中的每个标签的数据价值和业务价值,其中,所述数据价值基于生成所述标签的数据表确定,所述业务价值基于所述标签的历史访问数据确定,基于所述数据价值和业务价值,确定所述标签的综合价值,以及基于所述综合价值,从所述标签库中移除部分标签,得到目标标签库。可选地,确定多个所述标签中的每个标签的数据价值进一步包括基于生成所述标签的数据表以及生成所述标签的方式,确定所述标签的初始权重,基于多个标签之间的逻辑关系图,修正所述初始权重,得到每个标签的数据价值。可选地,所述基于多个标签之间的逻辑关系图,修正所述初始权重,得到每个标签的数据价值进一步包括获得多个标签之间的逻辑关系图,所述逻辑关系图为有向无环图,对于处于逻辑关系图中作为节点的标签,根据所述节点的入度确定每个来源的贡献值,以及基于所述贡献值和所述初始权重,确定所述标签的数据价值。可选地,确定多个所述标签中的每个标签的业务价值进一步包括获得多个所述标签中的每个标签的历史访问次数,最后访问时间以及调用方的数量,基于所述历史访问次数,最后访问时间以及调用方的数量确定标签的业务价值。可选地,所述方法还包括通过标签的访问量验证所述标签的综合价值。可选地,所述通过标签的访问量验证所述标签的综合价值包括获得标签访问量,将所述标签访问量和标签的综合价值分别归一化,按照标签访问量和标签的综合价值分别统计在多个区间中的标签的数量,基于所述数量,确定标签访问量和标签的综合价值之间的差异,在所述差异小于阈值时,确定所述标签的综合价值通过验证。可选地,所述确定多个所述标签中的每个标签的数据价值和业务价值,包括基于第一参数集合确定多个所述标签中的每个标签的数据价值和业务价值,所述基于所述数据价值和业务价值,确定所述标签的综合价值包括基于所述数据价值、业务价值以及第二参数集合确定所述标签的综合价值,所述方法还包括在所述差异不小于阈值时,调整所述第一参数集合和第二参数集合中的至少一个参数的值,以及基于调整后的第一参数集合和第二参数集合,重新确定所述标签的综合价值。本公开的另一方面提供了一种用于优化标签库的装置,包括获得模块、第一确定模块、第二确定模块以及优化模块。获得模块,用于获得标签库,所述标签库包括多个用于反映对象的特征的标签。第一确定模块,用于确定多个所述标签中的每个标签的数据价值和业务价值,其中,所述数据价值基于生成所述标签的数据表确定,所述业务价值基于所述标签的历史访问数据确定。第二确定模块,用于基于所述数据价值和业务价值,确定所述标签的综合价值。优化模块,用于基于所述综合价值,从所述标签库中移除部分标签,得到目标标签库。本公开的另一个方面提供了一种电子设备,包括处理器以及存储器。存储器上存储有计算机可读指令,所述指令被处理器执行时用于实现如上所述的方法。本公开的另一方面提供了一种非易失性存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。附图说明为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:图1示意性示出了根据本公开实施例的用于优化标签库的方法的流程图;图2示意性示出了根据本公开另一实施例的用于优化标签库的方法的流程图;图3A和图3B示意性示出了根据本公开实施例的确定多个标签的数据价值的示意图;图4示意性示出了根据本公开实施例的通过标签的访问量验证所述标签的综合价值的流程图;图5A和图5B示意性示出了根据本公开实施例的通过标签的访问量验证所述标签的综合价值的示意图;图6示意性示出了根据本公开实施例的用于优化标签库的装置的框图;以及图7示意性示出了根据本公开实施例的计算机系统的框图。具体实施方式以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。本公开的实施例提供了一种用于优化标签库的方法,包括获得包括多个用于反映对象的特征的标签的标签库,基于生成该标签的数据表确定的每个标签的数据价值,基于该标签的历史访问数据确定每个标签的业务价值,基于该数据价值和业务价值确定该标签的综合价值,并基于该综合价值,从标签库本文档来自技高网...

【技术保护点】
1.一种用于优化标签库的方法,包括:/n获得标签库,所述标签库包括多个用于反映对象的特征的标签;/n确定多个所述标签中的每个标签的数据价值和业务价值,其中,所述数据价值基于生成所述标签的数据表确定,所述业务价值基于所述标签的历史访问数据确定;/n基于所述数据价值和业务价值,确定所述标签的综合价值;以及/n基于所述综合价值,从所述标签库中移除部分标签,得到目标标签库。/n

【技术特征摘要】
1.一种用于优化标签库的方法,包括:
获得标签库,所述标签库包括多个用于反映对象的特征的标签;
确定多个所述标签中的每个标签的数据价值和业务价值,其中,所述数据价值基于生成所述标签的数据表确定,所述业务价值基于所述标签的历史访问数据确定;
基于所述数据价值和业务价值,确定所述标签的综合价值;以及
基于所述综合价值,从所述标签库中移除部分标签,得到目标标签库。


2.根据权利要求1所述的方法,其中,确定多个所述标签中的每个标签的数据价值进一步包括:
基于生成所述标签的数据表以及生成所述标签的方式,确定所述标签的初始权重;
基于多个标签之间的逻辑关系图,修正所述初始权重,得到每个标签的数据价值。


3.根据权利要求1所述的方法,其中,所述基于多个标签之间的逻辑关系图,修正所述初始权重,得到每个标签的数据价值进一步包括:
获得多个标签之间的逻辑关系图,所述逻辑关系图为有向无环图;
对于处于逻辑关系图中作为节点的标签,根据所述节点的入度确定每个来源的贡献值;以及
基于所述贡献值和所述初始权重,确定所述标签的数据价值。


4.根据权利要求1所述的方法,其中,确定多个所述标签中的每个标签的业务价值进一步包括:
获得多个所述标签中的每个标签的历史访问次数,最后访问时间以及调用方的数量;
基于所述历史访问次数,最后访问时间以及调用方的数量确定标签的业务价值。


5.根据权利要求1所述的方法,还包括:
通过标签的访问量验证所述标签的综合价值。


6.根据权利要求5所述的方法,其中,所述通过标签的访问量验证所述标签的综合价值包括:
获得标签访问量;
将所述标签访问量和标签的综合价值分别归一化;
按照标签访问量和标签的综合价值分别统计在多个区间中的标签的数量;
基于所述数量,确定标签访问量和标签的综合价值之间的差异;
在所述差异小于阈值时,确定所述标签的综合价值通过验证。


7.根据权利要求6所述的方法,其中,
所述确定多个所...

【专利技术属性】
技术研发人员:于博杰王永生
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1