【技术实现步骤摘要】
一种画像数据的构建方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,尤其涉及自然语言处理、数据处理等领域。
技术介绍
[0002]用户画像是基于待处理数据分析获得的对用户的一种认知表达,也是后续数据分析、数据建模、匹配业务需求等数据处理的起点。该用户画像可以通过数据统计的方式得到(通过收集及统计诸如用户社会属性、生活习惯、消费行为、兴趣点等待处理数据,可以得到用户画像)。
[0003]然而,目前的用户画像构建方式过于宽泛,导致构建的用户画像不精准,无法为后续的数据分析、数据建模、匹配业务需求等数据处理提供精准的数据支持。
技术实现思路
[0004]本公开提供了一种画像数据的构建方法、装置、电子设备以及存储介质。
[0005]根据本公开的一方面,提供了一种画像数据的构建方法,包括:
[0006]对从多个数据源获取的待处理数据进行数据处理,得到与所述待处理数据对应的多维度特征数据,所述多维度特征数据用于表征所述待处理数据对应的多种数据类型;
[0007]根据所述多维度特征数据,构建画像数据。
[0008]根据本公开的另一方面,提供了一种画像数据的构建装置,包括:
[0009]获取单元,用于对从多个数据源获取的待处理数据进行特征数据处理,得到与所述待处理数据对应的多维度特征数据,所述多维度特征数据用于表征所述待处理数据对应的多种数据类型;
[0010]画像构建单元,用于根据所述多维度特征数据,构建画像数据。
[0011]根 ...
【技术保护点】
【技术特征摘要】
1.一种画像数据的构建方法,包括:对从多个数据源获取的待处理数据进行特征数据处理,得到与所述待处理数据对应的多维度特征数据,所述多维度特征数据用于表征所述待处理数据对应的多种数据类型;根据所述多维度特征数据,构建画像数据。2.根据权利要求1所述的方法,还包括:根据所述画像数据对第一数据集合中的数据进行识别处理,得到与所述画像数据匹配的第一目标数据;或者,根据所述画像数据对第二数据集合中的数据进行聚类处理,得到与所述画像数据存在相似度的第二目标数据。3.根据权利要求1或2所述的方法,其中,所述对从多个数据源获取的待处理数据进行特征数据处理,得到与所述待处理数据对应的多维度特征数据,包括:对所述待处理数据进行第一数据处理,得到第一特征,所述第一特征用于表征所述待处理数据中第一数据和/或第一行为的基础特征;对所述待处理数据进行第二数据处理,得到第二特征,所述第二特征用于表征所述待处理数据中与所述第一数据和/或所述第一行为关联的高级特征,及所述待处理数据中所述第一数据与第二数据形成交互数据和/或交互行为情况下关联的高级特征;根据所述基础特征和所述高级特征,得到所述多维度特征数据。4.根据权利要求1或2所述的方法,其中,所述根据所述多维度特征数据,构建画像数据,包括:根据所述多维度特征数据,分别构建用户画像和文档画像;根据所述用户画像和所述文档画像,得到所述画像数据。5.根据权利要求1或2所述的方法,还包括:将从所述画像数据中提取的数据确定为初始数据;根据所述初始数据进行第三数据处理,得到第三特征,所述第三特征用于表征与所述初始数据对应的特征标签;将所述第三特征加入所述画像数据中,对所述画像数据进行更新处理。6.根据权利要求1或2所述的方法,还包括:将从所述画像数据中提取的数据确定为初始数据;根据所述初始数据进行第四数据处理,得到第四特征,所述第四特征用于表征基于所述初始数据筛选后得到的筛选特征、和/或与所述初始数据相关的衍生特征;将所述第四特征加入所述画像数据中,对所述画像数据进行更新处理。7.根据权利要求5或6所述的方法,还包括:获取目标数据,所述目标数据用于表征对所述画像数据进行更新处理后得到的更新数据;将所述目标数据确定为用于模型训练的训练数据。8.根据权利要求3所述的方法,其中,所述基础特征包括消费特征;所述高级特征包括生产特征和/或交互特征。9.一种画像数据的构建装置,包括:数据处理单元,用于对从多个数据源获取的待处理数据进行特征数据处理,得到与所
述待处理数据对应的多维度特征数据,所述多维度特征数据用于表征所述待处理数据对应的多种数据类型;画像构建单元,用于根据所述多维度特征数据,构建画像数据。10.根据权利要求9所述的装置,还包括:识别单元,用于根...
【专利技术属性】
技术研发人员:郑阳,吴广发,薛璐影,张玉东,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。