【技术实现步骤摘要】
标签存储方法、装置、设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种标签存储方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着经济社会的发展,针对不同的用户群体进行精准营销,可以提高企业竞争力,降低用户的购买成本,提高用户的购物体验。
[0003]标签系统是进行精准营销的基础,目前,用户群体一般都是通过不同的用户标签进行划分的,比如按照学历,将用户划分为专科、本科、研究生、博士等;按照性别将用户划分为男或女等。
[0004]这种方案在数据量大且标签数量比较多的时候,会造成存储膨胀。此外,当标签数量到达几万个时,容易造成存储的输入输出过高,存储压力过大,进而造成查询超时或服务不可用。进一步,由于查询时有缓存机制,每次加入缓存的标签数量很多,使缓存的压力也比较大,很容易导致慢查询。
[0005]综上所述,目前标签存储压力大。
技术实现思路
[0006]本专利技术提供一种标签存储方法、装置及计算机可读存储介质,其主要目的在于解决标签存储压力大的问题 ...
【技术保护点】
【技术特征摘要】
1.一种标签存储方法,其特征在于,所述方法包括:获取用户的基础数据,将所述基础数据中的标签值转换为二进制格式后,根据所述基础数据构建所述用户的多个标签模型表;将每个所述标签模型表存储到预设的空白的位图中,获取每个所述标签模型表在所述位图中的位置信息,拼接所述多个标签模型表,得到汇总标签模型表,根据所述汇总标签模型表及所述位置信息生成标签位图,并将所述标签位图进行行列转置,生成转换标签位图;将所述标签位图进行压缩,得到压缩标签位图,及将所述转换标签位图进行压缩,得到压缩转换标签位图,将所述压缩标签位图存储到预设的缓存中,以及将所述压缩转换标签位图存储到预设的数据库中。2.如权利要求1所述的标签存储方法,其特征在于,所述将所述基础数据中的标签值转换为二进制格式后,根据所述基础数据构建所述用户的多个标签模型表,包括:从所述用户的基础数据中提取标签、标签值;统计所述标签的数量得到列数量;根据所述列数量构建空白标签数据表;对所述标签值执行统一化处理,并将所述统一化处理后的标签值填充到所述空白标签数据表,得到所述用户对应的多个标签模型表。3.如权利要求2所述的标签存储方法,其特征在于,所述将每个所述标签模型表存储到预设的空白的位图中之前,所述方法还包括:利用预设的编号转换规则,在所述标签模型表中将所述基础数据中的用户名转化为用户编号;统计所述标签模型表中标签及用户编号的数量,根据所述标签及所述用户编号的数量构建空白的位图;构建所述空白的位图中位图位置与所述用户编号之间的映射关系分配机制,其中,所述映射关系分配机制为所述用户编号与所述位图位置的对应关系,用于查询时回填所述标签。4.如权利要求1所述的标签存储方法,其特征在于,所述拼接所述多个标签模型表,得到汇总标签模型表,根据所述汇总标签模型表及所述位置信息生成标签位图,包括:利用左连接命令将所述多个标签模型表进行拼接,得到汇总标签模型表;利用所述汇总标签模型表及所述位置信息,生成hivesql查询语句;将所述hivesql查询语句转换为MapReduce任务,并执行所述MapReduce任务,生成标签位图。5.如权利要求1所述的标签存储方法,其特征在于,所述将所述标签位图进行压缩,得到压缩标签位图,包括:利用自定义udf函数,将所述标签位图中二进制字符串每八位转换成一个字节,得到字节数组;将所述字节数组通过base64编码规则转化为压缩标签位图。6.如权利要求1所述的标签存储方法,其特征在于,所述将所述压缩转换标签位图存储到预设的数...
【专利技术属性】
技术研发人员:甘琪,秦斌,楚克明,魏勇,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。