用户标签处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38741359 阅读:11 留言:0更新日期:2023-09-08 23:25
本发明专利技术公开了一种用户标签处理方法、装置、电子设备及存储介质。该用户标签处理方法包括:生成多个用户的自增标识;对于单个标签,根据各所述用户与所述标签的对应关系生成高效压缩位图;将各所述标签对应的高效压缩位图存储至预设数据结构中。上述技术方案,利用高效压缩位图存储多个用户的标签,能够有效地压缩存储用户的标签数据,提高用户标签处理的效率和性能。率和性能。率和性能。

【技术实现步骤摘要】
用户标签处理方法、装置、电子设备及存储介质


[0001]本专利技术实施例涉及大数据
,尤其涉及一种用户标签处理方法、装置、电子设备及存储介质。

技术介绍

[0002]在现代互联网应用中,用户标签是一种重要的数据,可以用于用户画像、行为分析、智能推荐等领域。在实际应用中,往往需要存储和管理大量的标签数据。传统的标签存储方式通常采用关系型数据库或非关系型数据库,但这种方式过于复杂,不利于数据的快速访问和处理;并且标签数据的规模和复杂度越来越高,传统数据库的性能和扩展性也日益受到限制,标签存储和管理的效率偏低,性能有待提高。

技术实现思路

[0003]本专利技术提供了一种用户标签处理方法、装置、电子设备及存储介质,以提高用户标签处理的效率和性能。
[0004]第一方面,本专利技术实施例提供了一种用户标签处理方法,包括:
[0005]生成多个用户的自增标识(Identity document,ID);
[0006]对于单个标签,根据各所述用户与所述标签的对应关系生成高效压缩位图;
[0007]将各所述标签对应的高效压缩位图存储至预设数据结构中。
[0008]可选的,根据各所述用户与所述标签的对应关系生成高效压缩位图,包括:
[0009]根据各所述用户与所述标签的对应关系生成整数序列;
[0010]将所述整数序列映射至二进制位上,得到所述标签对应的高效压缩位图。
[0011]可选的,各所述标签对应的高效压缩位图存储至以相应标签的名称为索引的预设数据结构中。
[0012]可选的,所述预设数据结构包括B+树或哈希表。
[0013]可选的,在将各所述标签对应的高效压缩位图存储至预设数据结构中之后,还包括:
[0014]对各所述高效压缩位图进行位运算,以实现标签的查询操作。
[0015]可选的,在将各所述标签对应的高效压缩位图存储至预设数据结构中之后,还包括:
[0016]对指定标签对应的高效压缩位图进行增量更新,以添加或删除指定用户的指定标签。
[0017]可选的,各所述标签对应的高效压缩位图存储于多个分布式数据库节点。
[0018]第二方面,本专利技术实施例还提供了一种用户标签处理装置,包括:
[0019]标识生成模块,用于生成多个用户的自增标识;
[0020]位图生成模块,用于对于单个标签,根据各所述用户与所述标签的对应关系生成高效压缩位图;
[0021]存储模块,用于将各所述标签对应的高效压缩位图存储至预设数据结构中。
[0022]第三方面,本专利技术实施例提供了一种电子设备,包括:
[0023]一个或多个处理器;
[0024]存储装置,用于存储一个或多个程序;
[0025]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的用户标签处理方法。
[0026]第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的用户标签处理方法。
[0027]本专利技术实施例提供了一种用户标签处理方法、装置、电子设备及存储介质。用户标签处理方法包括:生成多个用户的自增标识;对于单个标签,根据各所述用户与所述标签的对应关系生成高效压缩位图;将各所述标签对应的高效压缩位图存储至预设数据结构中。上述技术方案,利用高效压缩位图存储多个用户的标签,能够有效地压缩存储用户的标签数据,提高用户标签处理的效率和性能。
附图说明
[0028]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
[0029]图1为本专利技术实施例一提供的一种用户标签处理方法的流程图;
[0030]图2为本专利技术实施例二提供的一种用户标签处理方法的流程图;
[0031]图3为本专利技术实施例三提供的一种用户标签处理装置的结构示意图;
[0032]图4为本专利技术实施例四提供的一种电子设备的结构示意图。
具体实施方式
[0033]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。此外,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0034]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0035]实施例一
[0036]图1为本专利技术实施例一提供的一种用户标签处理方法的流程图,本实施例可适用于处理用户标签的情况,例如可适用于互联网广告、电商推荐、社交网络等场景。具体的,该用户标签处理方法可以由用户标签处理装置执行,该用户标签处理装置可以通过软件和/或硬件的方式实现,并集成在电子设备中。进一步的,电子设备可以指台式计算机、服务器或笔记本电脑等。
[0037]如图1所示,该方法具体包括如下步骤:
[0038]S110、生成多个用户的自增标识。
[0039]其中,自增ID是一种自动生成并递增的数值,可用于作为每个用户的唯一标识符,用于区分不同用户。
[0040]S120、对于单个标签,根据各所述用户与所述标签的对应关系生成高效压缩位图。
[0041]其中,标签也称为用户标签,主要指对用户属性、兴趣、行为等进行描述和归纳的标签。本实施例中,标签可以分为基础标签和高级标签两类,基础标签一般包括用户的性别、年龄、地域、设备类型等基本属性,而高级标签则可以包括用户的偏好、兴趣、行为等更为细致和复杂的描述。
[0042]各用户与标签的对应关系主要指每个用户是否具有每个标签的属性。例如,用户A经常观看电影,则用户A具有“经常观看电影”这一标签的属性;用户B经常观看直播,则用户B具有“经常观看直播”这一标签的属性;用户C既经常看电影、又经常看直播,则用户C同时具有“经常观看电影”和“经常观看直播”这两个标签的属性。
[0043]位图(Bitmap)是一种数据结构,用于表示一组二元值的存在情况。传统的Bitmap存储方式存储空间占用较大,对于大规模的标签数据存储成本过高;并且运算速度也受到存储空间大小的限制,不适用于高维度、高密度的标签数据。本实施例中所采用的高效压缩位图(Roaring Bitmap)是一种基于位图的数据结构,也称为咆哮位图,其中的每个元素对应到Bit数组的其中一位,是一种优化的Bitmap实现本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户标签处理方法,其特征在于,包括:生成多个用户的自增标识;对于单个标签,根据各所述用户与所述标签的对应关系生成高效压缩位图;将各所述标签对应的高效压缩位图存储至预设数据结构中。2.根据权利要求1所述的方法,其特征在于,根据各所述用户与所述标签的对应关系生成高效压缩位图,包括:根据各所述用户与所述标签的对应关系生成整数序列;将所述整数序列映射至二进制位上,得到所述标签对应的高效压缩位图。3.根据权利要求1所述的方法,其特征在于,各所述标签对应的高效压缩位图存储至以相应标签的名称为索引的预设数据结构中。4.根据权利要求1所述的方法,其特征在于,所述预设数据结构包括B+树或哈希表。5.根据权利要求1所述的方法,其特征在于,在将各所述标签对应的高效压缩位图存储至预设数据结构中之后,还包括:对各所述高效压缩位图进行位运算,以实现标签的查询操作。6.根据权利要求1所述的方法,其特征在于,在将各所述标签对应的高效压缩位图存储至预设数据结构中之后,还包括:对指定标签...

【专利技术属性】
技术研发人员:姜春生
申请(专利权)人:北京如布科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1