一种获取用户画像的方法、设备和存储介质技术

技术编号:36506480 阅读:6 留言:0更新日期:2023-02-01 15:32
本申请提供了一种获取用户画像的方法、设备和存储介质,其基于获取到的全部业务系统中所有用户的原始用户标识数据,通过将用户ID标识和ID类型可信度、ID标识所属的业务系统重要程度相结合,得到可信度最高的、唯一的用户可信标识并建立该可信标识和用户ID标识之间的对应关系,进而使得用户通过该唯一用户可信标识快速获取不同业务系统中的用户数据,建立更准确的用户画像。准确的用户画像。准确的用户画像。

【技术实现步骤摘要】
一种获取用户画像的方法、设备和存储介质


[0001]本申请涉及数据处理领域,具体涉及一种获取用户画像的方法、设备和存储介质。

技术介绍

[0002]精准化服务、定制化服务已成为目前为终端用户提供服务的一种常见方式,通过精准化服务,可以大大提高终端用户的使用体验。而精准化服务的前提是对终端用户的用户画像的准确描述。现有技术中,当终端用户使用多个不同的业务系统时,通常会按照自身习惯使用不同类型的用户标识,因此,在采集终端用户的业务系统数据时,需要逐个对各个业务系统进行登录并获取数据,这种数据获取方式不仅效率低,且很容易由于失误造成数据采集不全面,进而造成用户画像的不准确。

技术实现思路

[0003]针对上述技术问题,本申请采用的技术方案为:一种获取用户画像的方法,包括以下步骤:S1000,获取用户的可信标识,其中,该可信标识用于唯一标识所述用户;S2000,基于用户的可信标识和预设的ID标识

可信标识对应表,获取用户在N个业务系统中的系统用户数据,其中,所述预设的ID标识

可信标识对应表用于表示不同用户的可信标识和其在N个业务系统中所使用的ID标识之间的对应关系,所述ID标识用于唯一标识与其对应的用户;S3000,基于所述系统用户数据获取所述用户的用户画像。
[0004]一种获取用户画像的设备,该设备包括有处理器和非瞬时性计算机可读存储介质,该存储介质用于保存至少一条指令或至少一段程序,所述处理器加载并执行所述至少一条指令或至少一段程序以实现以上所述的方法。
[0005]一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行以上所述的方法。
[0006]本申请至少具有以下技术效果:本申请基于获取到的全部业务系统中所有用户的原始用户标识数据,通过将用户ID标识和ID类型的可信度、ID标识所属的业务系统重要程度相结合,得到可信度最高的唯一的用户可信标识并建立该可信标识和用户ID标识之间的对应关系,进而使得用户通过该唯一用户可信标识快速获取不同业务系统中的用户数据,建立更准确的用户画像。
附图说明
[0007]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0008]图1为本申请实施例提供的一种获取用户画像的方法的流程图。
具体实施方式
[0009]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0010]本申请实施例提供一种获取用户画像的方法,如图1所示,该方法包括以下步骤:
[0011]S1000,获取用户的可信标识。
[0012]具体的,在本申请中,用户的可信标识可用于唯一标识用户,即通过该可信标识,可唯一确定该用户。且本领域技术人员可知,用户的ID标识也可以用于唯一标识用户,同一个用户可设置多个不同的用于标识自身的ID标识。
[0013]可信标识可为用户的ID标识中的任一个,在一个优选的实施例中,可信标识通过对用户的ID标识进行加密处理得到,其中,所述的加密处理可以为现有技术中任一种,例如,所述加密处理例如为获取用户的ID标识的MD5值以得到用户的可信标识。
[0014]S2000,基于用户的可信标识和预设的ID标识

可信标识对应表,获取用户在N个业务系统中的系统用户数据,其中,所述预设的ID标识

可信标识对应表用于表示不同用户的可信标识和其在N个业务系统中所使用的ID标识之间的对应关系。
[0015]在本申请中,N≥2,且本领域技术人员可以理解,N越大时,越容易因为疏忽造成用户在某个或某几个业务系统中的数据遗漏,因此,通过设置本申请中预设的ID标识

可信标识对应表,可以使用户仅通过可信标识即可快速获取用户在N个业务系统中的全部用户数据,此外,通过使用加密后的可信标识可以起到保护用户信息的作用。
[0016]进一步,系统用户数据例如可以是用户在系统中的系统设置数据,还可以是用户的系统使用数据等,本申请对系统用户数据的具体内容不做具体限定。本领域技术人员可知,有助于建立用户画像的系统用户数据均在本申请的保护范围之内。
[0017]S3000,基于所述系统用户数据获取所述用户的用户画像。
[0018]综合上述内容可知,本申请通过构建ID标识

可信标识对应表,可使用户仅通过可信标识即可快速获取用户在N个业务系统中的全部用户数据,避免因疏忽造成用户在某个或某几个业务系统中的数据遗漏,从而建立更准确的用户画像。
[0019]在本申请的一个优选实施例中,所述预设的ID标识

可信标识对应表的获取包括以下步骤:
[0020]S100,获取第一时间点N个业务系统中全部用户的第一用户原始数据,所述第一用户原始数据中的每条第一用户原始子数据包括同一用户在同一业务系统中的至少一个ID类型的ID标识。
[0021]在本申请中,所述N个业务系统为执行不同任务的独立业务系统,根据不同业务系统执行任务类型等的不同,所述N个业务系统被配置有用于表示系统重要程度的系统可信系数,具体的,系统可信系数和业务系统本身相关,业务系统本身越重要越可信,其对应的系统可信系数越高。ID类型可以为现有技术中已知的类型,例如移动通信号码、邮箱、用户自定义的用户名等等。
[0022]具体的,在该步骤中,通过采集各个业务系统中全部用户在第一时间点的用户标识信息以获取第一用户原始数据,其中,同一用户在同一个业务系统中的用户标识信息记
录在一条数据中,示例性的,如果有用户在第一个业务系统中设置的用户标识为:移动通信号码T1

ID1,移动通信号码T1

ID2,邮箱T2

ID1,则在第一时间点采集到的一条第一用户原始子数据分别为T1

ID1、T1

ID2、T2

ID1;如果有用户在第二个业务系统中设置的用户标识为:移动通信号码T1

ID1和T1

ID3,则在第一时间点采集到的另一条第一用户原始子数据为T1

ID1、T1

ID3。如果有用户在第一个业务系统中设置的用户标识为两个不同的移动通信号码T1

ID4、T1

ID5,则在第一时间点采集到的第三条第一用户原始子数据为T1

ID4、T1

...

【技术保护点】

【技术特征摘要】
1.一种获取用户画像的方法,其特征在于,包括以下步骤:S1000,获取用户的可信标识,其中,该可信标识用于唯一标识所述用户;S2000,基于用户的可信标识和预设的ID标识

可信标识对应表,获取用户在N个业务系统中的系统用户数据,其中,所述预设的ID标识

可信标识对应表用于表示不同用户的可信标识和其在N个业务系统中所使用的ID标识之间的对应关系,所述ID标识用于唯一标识与其对应的用户;S3000,基于所述系统用户数据获取所述用户的用户画像。2.根据权利要求1所述的方法,其特征在于,所述预设的ID标识

可信标识对应表的获取包括以下步骤:S100,获取第一时间点N个业务系统中全部用户的第一用户原始数据,所述第一用户原始数据中的每条第一用户原始子数据包括同一用户在同一业务系统中的至少一个ID类型的ID标识;S200,根据第一用户原始数据,获取符合第一ID类型的第一用户数据,其中,第一用户数据中的每条第一用户子数据至少包括标识关联部分和系统可信系数两部分,标识关联部分通过提取与该条第一用户子数据对应的一条第一用户原始子数据中符合第一ID类型的ID标识得到,系统可信系数用于表示该条第一用户子数据所属业务系统的重要程度;所述第一ID类型为可信等级最高的ID类型;S300,根据第一ID类型的可信等级获取数据处理循环次数阈值TL,设置数据处理循环次数L=1,并将第一用户数据作为第一输入数据,对第一输入数据进行第一数据处理,得到对应于第一ID类型的第一输出数据,其中,所述对应于第一ID类型的第一输出数据中的每一条至少用于保存用户的符合第一ID类型的一个ID标识和该用户的可信标识之间的对应关系;S400,根据所述对应于第一ID类型的第一输出数据和第一用户原始数据,获取所述预设的ID标识

可信标识对应表;其中,所述第一数据处理包括以下步骤:S301,对第一输入数据中的每条第一用户子数据进行数据拆分,得到第一拆分数据,所述数据拆分具体包括:对于每条第一用户子数据,根据其标识关联部分包含的ID标识数量P,拆分为P条包括用户标识部分、标识关联部分和系统可信系数的第一拆分子数据,其中,P个ID标识分别对应P条第一拆分子数据的用户标识部分,P条第一拆分子数据的标识关联部分和与其对应的第一用户子数据的标识关联部分相同,P条第一拆分子数据的系统可信系数和与其对应的第一用户子数据的系统可信系数相同;S302,基于第一拆分数据得到第一合并数据,其中,将用户标识部分相同的所有第一拆分子数据进行合并操作以得到第一合并数据中的一条第一合并子数据,且,第一合并子数据的用户标识部分和与其对应的任意一条第一拆分子数据的用户标识部分相同,第一合并子数据的标识关联部分为与其对应的所有第一拆分子数据的标识关联部分的并集,第一合并子数据的系统可信系数为与其对应的所有第一拆分子数据的系统可信系数的和;S303,如果L<TL,则执行S304,否则,执行S305;S304,设置L=L+1,将第一合并数据中的标识关联部分和系统可信系数作为第一用户数据,返回执行S301;
S305,对第一合并数据中的每一条第一合并子数据增加用户可信标识部分得到第一合并处理数据,其中,所述用户可信标识部分通过对相应的第一合并子数据中的用户标识部分进行加密得到;S306,对第一合并处理数据中的每条第一合并处理子数据进行数据分解,得到第一分解数据,所述数据分解具体包括:对于每条第一合并处理子数据,根据其标识关联部分包含的ID标识数量Q,分解为Q条包括用户标识部分、用户可信标识部分和系统可信系数的第一分解子数据,其中,Q个ID标识分别对应Q条第一分解子数据的用户标识部分,Q条第一分解子数据的用户可信标识部分和与其对应的第一合并处理子数据的用户可信标识部分相同,Q条第一分解子数据的系统可信系数和与其对应的第一合并处理子数据的系统可信系数相同;S307,基于第一分解数据得到第一输出数据,其中,将用户标识部分相同的所有第一分解子数据中系统可信系数最大的一条第一分解子数据进行保存以得到第一输出数据中的一条第一输出子数据。3.根据权利要求2所述的方法,其特征在于,S400具体包括:对于对应于第一ID类型的第一输出数据中的每一条第一输出子数据,根据其用户标识部分,在第一用户原始数据中查找包含该条第一输出子数据的用户标识部分的至少一条第一用户原始子数据,并将所述至少一条第一用户原始子数据中的非第一ID类型的其它类型ID标识中的每一个,按照用户标识部分和用户可信标识部分的方式新增至第...

【专利技术属性】
技术研发人员:袁凯叶新江许世杰张燕山
申请(专利权)人:每日互动股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1