一种分级的用户标签库的创建的方法和装置制造方法及图纸

技术编号:18426405 阅读:27 留言:0更新日期:2018-07-12 02:00
本发明专利技术公开了一种分级的用户标签库的创建的方法,所述方法包括:接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。本发明专利技术还公开了一种分级的用户标签库的创建的装置。

Method and device for creating hierarchical user tag library

The invention discloses a method of creating a hierarchical user tag library. The method includes: after receiving the log information, it determines whether the user identity identification field is contained in the log information, and the log information is stored in the main library in the user tag library when the user identity identification field is included in the log information. When the log information does not contain the user identity identification field, the type of type identifier of the log information described in the log information is obtained, and the first projection library that matches the type identifier of the log information in all projection libraries in the user tag library is found, and the log letter is found when the search is successful. The interest is stored in the first projection library; when the lookup fails, a new second projection library is built in the user tag library, the log information is stored in the second projection library, and the type of the second projection library is marked as the type identifier of the log information. The invention also discloses a device for creating a hierarchical user tag library.

【技术实现步骤摘要】
一种分级的用户标签库的创建的方法和装置
本专利技术涉及数据挖掘领域,尤其涉及一种分级的用户标签库的创建的方法和装置。
技术介绍
随着移动互联网的发展和普及,移动智能终端得到了大规模的应用。在空闲时,人们往往喜欢打开移动智能终端、登陆APP来访问互联网;此时,APP会对用户的操作(比如在购物网站上购买商品,付费等操作)进行跟踪,生成日志信息,并将日志信息发送到服务器,服务器会利用日志信息建立用户标签库;之后,通过标签库中的日志信息对用户进行画像,基于用户画像对用户进行分群,然后针对不同用户进行精确广告投放和商品推荐等。在现有技术中,通常用户标签库的构造如图1所示,在整个用户标签库中,使用用户唯一标识符来唯一的标识一个用户,将该用户的每条日志信息都对应到该用户唯一标识符,即只要使用用户唯一标识符就可以获取该用户的所有日志信息;此处,用户唯一标识符一般为身份证号、手机号码等能够唯一确定一个用户身份的标识符,但用户唯一标识符涉及到用户的隐私,且一般会涉及法律问题,因此,在构建这种类型的用户标签库就会存在着困难。在一些细分场景,这种“大而全”用户标签库显得很臃肿,不便于使用。由于这种类型的用户标签库是“大而全”的,导致其购买费用比较高。因此,亟需一种适用于实际场景、体量适中、便于使用且成本低的用户标签库,及其创建方法。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种适用于实际场景、体量适中、便于使用且成本低的用户标签库的创建的方法和装置。为达到上述目的,本专利技术的技术方案是这样实现的:本专利技术实施例提供了一种分级的用户标签库的创建的方法,包括以下步骤:接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。上述方案中,所述接收日志信息,包括:接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。上述方案中,所述确定所述日志信息中是否包含用户身份标识字段,包括:确定所述日志信息中是否包含手机号码或身份证号。上述方案中,所述获取所述日志信息中的标示所述日志信息的类型的类型标识符,包括:获取所述日志信息中包含的终端编号和应用程序编号。本专利技术实施例提供了一种分级的用户标签库的整理方法,所述方法包括:对于主库中所存储的任一第二日志信息,如果在所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链接。本专利技术实施例提供了一种分级的用户标签库的创建的装置,所述装置包括:主库处理模块,用于接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;投影库处理模块,用于所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。上述方案中,所述主库处理模块,具体用于:接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。上述方案中,所述主库处理模块,具体用于:确定所述日志信息中是否包含手机号码或身份证号。上述方案中,投影库处理模块,具体用于:获取所述日志信息中包含的终端编号和应用程序编号。本专利技术实施例提供了一种分级的用户标签库的整理装置,包括以下模块:整理模块,用于对于主库中所存储的任一第二日志信息,如果在所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链接。本专利技术实施例提供的分级的用户标签库的创建的方法和装置,接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。如此,提供适用于实际场景、体量适中、便于使用且成本低的用户标签库。附图说明图1为现有技术中用户标签库的架构示意图;图2为本专利技术实施例的分级的用户标签库的创建的方法的流程示意图;图3为本专利技术实施例的分级的用户标签库的创建的装置的组成结构示意图。具体实施方式本专利技术实施例中,接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。下面结合实施例对本专利技术的技术方案作进一步详细的说明。本专利技术实施例提供了一种分级的用户标签库的创建的方法,如图2所示,包括以下步骤:步骤201:接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;下面是一些常见的日志信息:当用户在智能移动终端上使用APP(Application,计算机应用程序)时,APP会自动记录用户的操作,并将这些操作转换成拥有固定格式的日志信息,然后将这些日志信息发送给服务器,服务器就会接收到这些日志信息;出于安全的考虑,APP一般无法获取到手机号码或身份证号等,因此,为了能够唯一的标识该智能移动终端,APP通常会给智能移动终端分配唯一的编号(记为TerminalID,TerminalIdentification,终端编号),同时为了与其他APP区分开来,会给APP分配唯一的应用程序编号(记为APPID,ApplicationIdentification,应用程序编号)。例如,APPID:xxxx,TermianlID:563436343,TAG:消费者,消费233,访问页面5个,停留时间23S。所述终端编号可以为IMEI(InternationalMobileEquip本文档来自技高网...

【技术保护点】
1.一种分级的用户标签库的创建的方法,其特征在于,包括以下步骤:接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。

【技术特征摘要】
1.一种分级的用户标签库的创建的方法,其特征在于,包括以下步骤:接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。2.根据权利要求1所述的分级的用户标签库的创建的方法,其特征在于,所述接收日志信息,包括:接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。3.根据权利要求1所述的分级的用户标签库的创建的方法,其特征在于,所述确定所述日志信息中是否包含用户身份标识字段,包括:确定所述日志信息中是否包含手机号码或身份证号。4.根据权利要求1所述的分级的用户标签库的创建的方法,其特征在于,所述获取所述日志信息中的标示所述日志信息的类型的类型标识符,包括:获取所述日志信息中包含的终端编号和应用程序编号。5.一种分级的用户标签库的整理方法,其特征在于,所述方法包括:对于主库中所存储的任一第二日志信息,如果在所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链...

【专利技术属性】
技术研发人员:杨剑青
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1