【技术实现步骤摘要】
一种获取用户画像的方法、设备和存储介质
[0001]本申请涉及数据处理领域,具体涉及一种获取用户画像的方法、设备和存储介质。
技术介绍
[0002]精准化服务、定制化服务已成为目前为终端用户提供服务的一种常见方式,通过精准化服务,可以大大提高终端用户的使用体验。而精准化服务的前提是对终端用户的用户画像的准确描述。现有技术中,当终端用户使用多个不同的业务系统时,通常会按照自身习惯使用不同类型的用户标识,因此,在采集终端用户的业务系统数据时,需要逐个对各个业务系统进行登录并获取数据,这种数据获取方式不仅效率低,且很容易由于失误造成数据采集不全面,进而造成用户画像的不准确。
技术实现思路
[0003]针对上述技术问题,本申请采用的技术方案为:一种获取用户画像的方法,包括以下步骤:S1000,获取用户的可信标识,其中,该可信标识用于唯一标识所述用户;S2000,基于用户的可信标识和预设的ID标识
‑
可信标识对应表,获取用户在N个业务系统中的系统用户数据,其中,所述预设的ID标识
‑
可信标识对应表用于表示不同用户的可信标识和其在N个业务系统中所使用的ID标识之间的对应关系,所述ID标识用于唯一标识与其对应的用户;S3000,基于所述系统用户数据获取所述用户的用户画像。
[0004]一种获取用户画像的设备,该设备包括有处理器和非瞬时性计算机可读存储介质,该存储介质用于保存至少一条指令或至少一段程序,所述处理器加载并执行所述至少一条指令或至少一段程序以实现以上所述的方法。
【技术保护点】
【技术特征摘要】
1.一种获取用户画像的方法,其特征在于,包括以下步骤:S1000,获取用户的可信标识,其中,该可信标识用于唯一标识所述用户;S2000,基于用户的可信标识和预设的ID标识
‑
可信标识对应表,获取用户在N个业务系统中的系统用户数据,其中,所述预设的ID标识
‑
可信标识对应表用于表示不同用户的可信标识和其在N个业务系统中所使用的ID标识之间的对应关系,所述ID标识用于唯一标识与其对应的用户;S3000,基于所述系统用户数据获取所述用户的用户画像。2.根据权利要求1所述的方法,其特征在于,所述预设的ID标识
‑
可信标识对应表的获取包括以下步骤:S100,获取第一时间点N个业务系统中全部用户的第一用户原始数据,所述第一用户原始数据中的每条第一用户原始子数据包括同一用户在同一业务系统中的至少一个ID类型的ID标识;S200,根据第一用户原始数据,获取符合第一ID类型的第一用户数据,其中,第一用户数据中的每条第一用户子数据至少包括标识关联部分和系统可信系数两部分,标识关联部分通过提取与该条第一用户子数据对应的一条第一用户原始子数据中符合第一ID类型的ID标识得到,系统可信系数用于表示该条第一用户子数据所属业务系统的重要程度;所述第一ID类型为可信等级最高的ID类型;S300,根据第一ID类型的可信等级获取数据处理循环次数阈值TL,设置数据处理循环次数L=1,并将第一用户数据作为第一输入数据,对第一输入数据进行第一数据处理,得到对应于第一ID类型的第一输出数据,其中,所述对应于第一ID类型的第一输出数据中的每一条至少用于保存用户的符合第一ID类型的一个ID标识和该用户的可信标识之间的对应关系;S400,根据所述对应于第一ID类型的第一输出数据和第一用户原始数据,获取所述预设的ID标识
‑
可信标识对应表;其中,所述第一数据处理包括以下步骤:S301,对第一输入数据中的每条第一用户子数据进行数据拆分,得到第一拆分数据,所述数据拆分具体包括:对于每条第一用户子数据,根据其标识关联部分包含的ID标识数量P,拆分为P条包括用户标识部分、标识关联部分和系统可信系数的第一拆分子数据,其中,P个ID标识分别对应P条第一拆分子数据的用户标识部分,P条第一拆分子数据的标识关联部分和与其对应的第一用户子数据的标识关联部分相同,P条第一拆分子数据的系统可信系数和与其对应的第一用户子数据的系统可信系数相同;S302,基于第一拆分数据得到第一合并数据,其中,将用户标识部分相同的所有第一拆分子数据进行合并操作以得到第一合并数据中的一条第一合并子数据,且,第一合并子数据的用户标识部分和与其对应的任意一条第一拆分子数据的用户标识部分相同,第一合并子数据的标识关联部分为与其对应的所有第一拆分子数据的标识关联部分的并集,第一合并子数据的系统可信系数为与其对应的所有第一拆分子数据的系统可信系数的和;S303,如果L<TL,则执行S304,否则,执行S305;S304,设置L=L+1,将第一合并数据中的标识关联部分和系统可信系数作为第一用户数据,返回执行S301;
S305,对第一合并数据中的每一条第一合并子数据增加用户可信标识部分得到第一合并处理数据,其中,所述用户可信标识部分通过对相应的第一合并子数据中的用户标识部分进行加密得到;S306,对第一合并处理数据中的每条第一合并处理子数据进行数据分解,得到第一分解数据,所述数据分解具体包括:对于每条第一合并处理子数据,根据其标识关联部分包含的ID标识数量Q,分解为Q条包括用户标识部分、用户可信标识部分和系统可信系数的第一分解子数据,其中,Q个ID标识分别对应Q条第一分解子数据的用户标识部分,Q条第一分解子数据的用户可信标识部分和与其对应的第一合并处理子数据的用户可信标识部分相同,Q条第一分解子数据的系统可信系数和与其对应的第一合并处理子数据的系统可信系数相同;S307,基于第一分解数据得到第一输出数据,其中,将用户标识部分相同的所有第一分解子数据中系统可信系数最大的一条第一分解子数据进行保存以得到第一输出数据中的一条第一输出子数据。3.根据权利要求2所述的方法,其特征在于,S400具体包括:对于对应于第一ID类型的第一输出数据中的每一条第一输出子数据,根据其用户标识部分,在第一用户原始数据中查找包含该条第一输出子数据的用户标识部分的至少一条第一用户原始子数据,并将所述至少一条第一用户原始子数据中的非第一ID类型的其它类型ID标识中的每一个,按照用户标识部分和用户可信标识部分的方式新增至第...
【专利技术属性】
技术研发人员:袁凯,叶新江,许世杰,张燕山,
申请(专利权)人:每日互动股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。