用户画像数据处理方法及装置制造方法及图纸

技术编号:20182734 阅读:78 留言:0更新日期:2019-01-23 02:25
本公开是关于用户画像数据处理方法及装置。方法包括:根据预先确定的至少两个TAC,批量生成基于各TAC的imei;将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系;搜索出第一用户画像数据中已关联单个imeiMD5的设备标签;根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,并将目标imeiMD5与第一imeiMD5关联至同一个设备标签。本公开能够提高数据质量,提高信息推送的准确性和可靠性。

User Portrait Data Processing Method and Device

The present disclosure relates to a method and device for data processing of user portraits. The methods include: batch generation of IMEI based on each TAC according to at least two pre-determined TACs; matching each IMEI encrypted with imeiMD5 in the first user's portrait data with device labels as keywords to establish the mapping relationship between each IMEI and imeiMD5 in the first user's portrait data; searching for device labels associated with a single imeiMD5 in the first user's portrait data; and double-card matching. The last bit of the SNR of the two IMEI to be equipped is the characteristic and mapping relationship of the serial relationship. The target imeiMD5 of the same device is identified in the first user portrait data associated with the first imeiMD5, and the target imeiMD5 is associated with the first imeiMD5 to the same device label. The disclosure can improve data quality and accuracy and reliability of information push.

【技术实现步骤摘要】
用户画像数据处理方法及装置
本公开涉及数据处理
,尤其涉及用户画像数据处理方法及装置。
技术介绍
目前在数据统计领域,因为统计的维度不同,一定会涉及到用户标识(id)和设备id这两种id的关联,推送面对海量的用户id数据和复杂的统计逻辑,需要在数据清洗和数据分析层面对不同id进行映射整合。相关技术中,通过将各类用户id和设备id进行关联映射和聚合,以提升数据质量。
技术实现思路
为克服相关技术中存在的问题,本公开实施例提供一种用户画像数据处理方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种用户画像数据处理方法,方法包括:根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。本公开的实施例提供的技术方案可以包括以下有益效果:该技术方案根据批量生成的各imei与第一用户画像数据中imeiMD5的映射关系,利用双卡双待设备的两个imei的SNR最后一位为连号关系的特性,搜索到第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,将第一imeiMD5和目标imeiMD5确定为同一双卡双待设备的两个imei所对应的imeiMD5并进行关联,从而达到数据聚合的目的,能够提高数据质量,如此,能够提高信息推送的准确性和可靠性。在一个实施例中,所述根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,包括:根据所述映射关系,确定各所述imei中与所述第一imeiMD5对应的第一imei、及与所述第一imei的SNR最后一位为连号关系的第二imei和第三imei;根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;确定所述第一用户画像数据中所述第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeiMD5确定为所述目标imeiMD5。在一个实施例中,所述方法还包括:搜索出所述第一用户画像数据中已关联两个imeiMD5的设备标签;根据所述映射关系,确定各所述imei中与所述两个imeiMD5分别对应的两个imei;当所述两个imei的SNR最后一位不是连号关系时,将所述两个imeiMD5确定为脏数据;将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。在一个实施例中,在所述将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配之前,所述方法还包括:获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。在一个实施例中,所述加密后的设备标识,包括:imeiMD5、加密后的移动设备识别码meidMD5、及MacMD5。根据本公开实施例的第二方面,提供一种用户画像数据处理装置,装置包括:第一生成模块,用于根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;映射模块,用于将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;第一搜索模块,用于搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;关联模块,用于根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。在一个实施例中,所述关联模块,包括:第一确定子模块,用于根据所述映射关系,确定各所述imei中与所述第一imeiMD5对应的第一imei、及与所述第一imei的SNR最后一位为连号关系的第二imei和第三imei;第二确定子模块,用于根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;第三确定子模块,用于确定所述第一用户画像数据中所述第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;第四确定子模块,用于将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeiMD5确定为所述目标imeiMD5。在一个实施例中,所述装置还包括:第二搜索模块,用于搜索出所述第一用户画像数据中已关联两个imeiMD5的设备标签;确定模块,用于根据所述映射关系,确定各所述imei中与所述两个imeiMD5分别对应的两个imei;过滤模块,用于当所述两个imei的SNR最后一位不是连号关系时,将所述两个imeiMD5确定为脏数据,及将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。在一个实施例中,所述装置还包括:获取模块,用于获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;第二生成模块,用于将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。根据本公开实施例的第三方面,提供一种用户画像数据处理装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一本文档来自技高网...

【技术保护点】
1.一种用户画像数据处理方法,其特征在于,包括:根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息‑摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。

【技术特征摘要】
1.一种用户画像数据处理方法,其特征在于,包括:根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。2.根据权利要求1所述的方法,其特征在于,所述根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,包括:根据所述映射关系,确定各所述imei中与所述第一imeiMD5对应的第一imei、及与所述第一imei的SNR最后一位为连号关系的第二imei和第三imei;根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;确定所述第一用户画像数据中所述第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeiMD5确定为所述目标imeiMD5。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:搜索出所述第一用户画像数据中已关联两个imeiMD5的设备标签;根据所述映射关系,确定各所述imei中与所述两个imeiMD5分别对应的两个imei;当所述两个imei的SNR最后一位不是连号关系时,将所述两个imeiMD5确定为脏数据;将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。4.根据权利要求1所述的方法,其特征在于,在所述将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配之前,所述方法还包括:获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。5.根据权利要求4所述的方法,其特征在于,所述加密后的设备标识,包括:imeiMD5、加密后的移动设备识别码meidMD5、及MacMD5。6.一种用户画像数据处理装置,其特征在于,包括:第一生成模块,用于根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;映射模块,用于将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关...

【专利技术属性】
技术研发人员:钱佳曹文博
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1