用户画像生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21036612 阅读:41 留言:0更新日期:2019-05-04 06:15
本申请涉及一种用户画像生成方法。涉及数据处理领域,该方法包括:从多个子系统拉取数据源;从数据源中提取数据单元,每个数据单元对应唯一的用户身份字段;识别数据单元所包含的数据类型,根据数据单元的数据类型统计对应子系统的数据类型集合;根据数据类型集合确定每个子系统对应的数据转换模型;通过数据转换模型对相应子系统中的数据单元进行特征提取,并将提取的特征数据转换成预先定义的数据格式;将多个子系统之间对应同一用户身份字段的特征数据进行合并,生成每个用户身份字段对应的特征数据集合;根据特征数据集合生成相应用户的用户画像。采用本方法能够提高用户画像的生成效率且生成的用户画像的标签覆盖率更高。

User Portrait Generation Method, Device, Computer Equipment and Storage Media

【技术实现步骤摘要】
用户画像生成方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种用户画像生成方法、装置、计算机设备和存储介质。
技术介绍
随着电子商务的发展,客户服务面对的服务对象类型、服务人数等均在大幅增加,行业竞争日趋激烈,如何更好的为用户提供个性化服务是企业面临的难题。因此,大数据用户画像应运而生,它也称为用户角色。传统应用中都是赖人工的工作经验,通过人工打标签的方式生成用户角色,或者通过对片面数据的简单的规则判断来生成用户角色。无论是人工生成还是简单的规则化生成均存在生成效率低,标签覆盖率低等缺陷。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高用户画像的生成效率且生成的用户画像的标签覆盖率更高的用户画像生成方法、装置、计算机设备和存储介质。一种用户画像生成方法,所述方法包括:从多个子系统拉取数据源;从所述数据源中提取数据单元,每个所述数据单元对应唯一的用户身份字段;识别所述数据单元所包含的数据类型,根据所述数据单元的数据类型统计对应子系统的数据类型集合;根据所述数据类型集合确定每个所述子系统对应的数据转换模型;通过所述数据转换模型对相应子系统中的所述数据单本文档来自技高网...

【技术保护点】
1.一种用户画像生成方法,所述方法包括:从多个子系统拉取数据源;从所述数据源中提取数据单元,每个所述数据单元对应唯一的用户身份字段;识别所述数据单元所包含的数据类型,根据所述数据单元的数据类型统计对应子系统的数据类型集合;根据所述数据类型集合确定每个所述子系统对应的数据转换模型;通过所述数据转换模型对相应子系统中的所述数据单元进行特征提取,并将提取的特征数据转换成预先定义的数据格式;将多个子系统之间对应同一所述用户身份字段的所述特征数据进行合并,生成每个所述用户身份字段对应的特征数据集合;根据所述特征数据集合生成相应用户的用户画像。

【技术特征摘要】
1.一种用户画像生成方法,所述方法包括:从多个子系统拉取数据源;从所述数据源中提取数据单元,每个所述数据单元对应唯一的用户身份字段;识别所述数据单元所包含的数据类型,根据所述数据单元的数据类型统计对应子系统的数据类型集合;根据所述数据类型集合确定每个所述子系统对应的数据转换模型;通过所述数据转换模型对相应子系统中的所述数据单元进行特征提取,并将提取的特征数据转换成预先定义的数据格式;将多个子系统之间对应同一所述用户身份字段的所述特征数据进行合并,生成每个所述用户身份字段对应的特征数据集合;根据所述特征数据集合生成相应用户的用户画像。2.根据权利要求1所述的方法,其特征在于,所述根据所述特征数据集合生成相应用户的用户画像,包括:将所述特征数据集合输入至标签生成模型中,输出所述特征数据集合对应的特征标签集合,根据所述特征数据集合与所述用户身份字段之间的对应关系,得到每个所述用户身份字段对应的特征标签集合;根据所述特征标签集合生成相应用户的用户画像。3.根据权利要求1所述的方法,其特征在于,所述从所述数据源中提取数据单元,每个所述数据单元对应唯一的用户身份字段,包括:将对应同一用户标识的数据组合成数据单元;查找所述用户标识是否对应用户身份字段,若是,将所述用户身份字段与所述用户标识对应的所述数据单元关联;若否,将所述用户标识对应的数据单元标记为待实名数据单元;所述方法还包括:根据所述待实名数据单元生成待实名用户的用户画像;从所述用户画像中提取用户特征标签;查找与所述用户特征标签相匹配的目标用户画像,将所述待实名用户的用户画像与所述目标用户画像进行合并。4.根据权利要求1至3任意一项所述的方法,其特征在于,所述将所述多个子系统之间对应同一所述用户身份字段的所述特征数据进行合并,包括:当同一所述用户身份字段有两个相同维度的特征数据时,计算两个所述特征数据的相似度,若所述相似度大于设定阈值,则保留其一作为所述特征数据集中的特征数据;若所述相似度小于设定阈值,将组合两个所述特征数据,或者保留两个所述特征数据。5.根据权利要求1所述的方法,其特征在于,在通过所述数据转换模型对相应子系统中的所述数据单元进行特征提取,并将提取的特征数据转换成预先定义的数据格式之后,还包...

【专利技术属性】
技术研发人员:吴元新冯跃东
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1