一种存储数据的方法和装置制造方法及图纸

技术编号:24455871 阅读:49 留言:0更新日期:2020-06-10 15:31
本发明专利技术公开了一种存储数据的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:将用户标识进行拆分,得到第一标识和第二标识;将所述第一标识存储至主键,将所述第二标识存储至字段;将所述用户标识对应的标签数据转换为位数组,将所述位数组存储至主键值。该实施方式能够解决数据查询效率低的技术问题。

A method and device for storing data

【技术实现步骤摘要】
一种存储数据的方法和装置
本专利技术涉及计算机
,尤其涉及一种存储数据的方法和装置。
技术介绍
在大数据存储匹配查询场景中,通过布隆过滤器对数据进行存储,以此来对数据进行匹配查询。比如广告投放的场景中,将选择好的标签数据通过在数据库(如hive等)中进行数据筛选,然后将投放人群存储于布隆过滤器当中,以此来达到投放效果的实时性。在算法模型构建中,经常会使用hive或者spark对数据进行存储和使用,来提取模型的特征数据,然后以提取出的特征数据进行模型的匹配。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:在广告投放的场景中,如果投放标签变动,需要重新计算投放的人群,然后将投放人群存储于布隆过滤器中,这样会严重地影响时效性。而且在多个广告主同时投放时,如果投放广告主过多,需要多次访问布隆过滤器,如果存在请求响应延时,会导致投放效率大大降低,并且在投放时如果在选择标签后立刻需要投放,布隆过滤器无法支撑。而在构建算法模型时,如果利用hive或者spark进行特征提取,则会在数据查询阶段浪费许多的时间,而且本文档来自技高网...

【技术保护点】
1.一种存储数据的方法,其特征在于,包括:/n将用户标识进行拆分,得到第一标识和第二标识;/n将所述第一标识存储至主键,将所述第二标识存储至字段;/n将所述用户标识对应的标签数据转换为位数组,将所述位数组存储至主键值。/n

【技术特征摘要】
1.一种存储数据的方法,其特征在于,包括:
将用户标识进行拆分,得到第一标识和第二标识;
将所述第一标识存储至主键,将所述第二标识存储至字段;
将所述用户标识对应的标签数据转换为位数组,将所述位数组存储至主键值。


2.根据权利要求1所述的方法,其特征在于,将所述第一标识存储至主键,将所述第二标识存储至字段,包括:
采用信息摘要算法计算所述第一标识的第一摘要值,将所述第一摘要值存储至主键;
采用信息摘要算法计算所述第二标识的第二摘要值,将所述第二摘要值存储至字段。


3.根据权利要求2所述的方法,其特征在于,所述信息摘要算法为MD5信息摘要算法。


4.根据权利要求1所述的方法,其特征在于,所述用户标识为m+n位数据,所述第一标识为所述用户标识中连续的前m位数据,所述第二标识为所述用户标识中连续的后n位数据。


5.根据权利要求1所述的方法,其特征在于,将所述用户标识对应的标签数据转换为位数组,包括:
所述用户标识对应的标签数据中的每一个特征占用位数组中的一个比特位;
其中,所述...

【专利技术属性】
技术研发人员:刘洋
申请(专利权)人:京东数字科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1