用户画像的构建方法、装置和电子设备制造方法及图纸

技术编号:37668627 阅读:14 留言:0更新日期:2023-05-26 04:29
本申请提供一种用户画像的构建方法、装置和电子设备,涉及数据处理技术领域。该方法包括:通过获取目标用户对应的多模态数据,多模态数据包括音频数据、视频数据、图像数据或者文本数据中的至少两种;并基于目标用户对应的多模态数据,确定多模态数据对应的目标文本数据,目标文本数据包括多模态数据中非文本数据转换后得到的转换文本数据,或者,目标文本数据包括转换文本数据和文本数据;再基于目标文本数据和多模态数据共同构建目标用户对应的用户画像,相比于采用单一的文本数据构建用户画像,可以准确地进行用户画像构建,从而提高了构建得到的用户画像的准确度。了构建得到的用户画像的准确度。了构建得到的用户画像的准确度。

【技术实现步骤摘要】
用户画像的构建方法、装置和电子设备


[0001]本申请涉及数据处理
,尤其涉及一种用户画像的构建方法、装置和电子设备。

技术介绍

[0002]大数据技术是一种以任何系统的全部数据资源为对象,并从中发现数据之间的相关性关系的信息处理技术。目前已经广泛应用于广告推送、用户个性化服务与改善等较多领域。
[0003]用户画像作为大数据技术的重要应用,其目标是在多维度上建立用户的属性标签,以根据属性标签勾勒用户特征,使得后续可以根据用户特征分析用户偏好,从而为用户提供更高效、更有针对性的信息推送或者更贴近个人习惯的用户体验。
[0004]因此,如何准确地进行用户画像的构建,是本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]本申请提供一种用户画像的构建方法、装置和电子设备,可以准确地进行用户画像构建,从而提高了构建得到的用户画像的准确度。
[0006]本申请提供一种用户画像的构建方法,包括:
[0007]获取目标用户对应的多模态数据,所述多模态数据包括音频数据、视频数据、图像数据或者文本数据中的至少两种。
[0008]确定所述多模态数据对应的目标文本数据,所述目标文本数据包括所述多模态数据中非文本数据转换后得到的转换文本数据,或者,所述目标文本数据包括所述转换文本数据和所述文本数据。
[0009]基于所述目标文本数据和所述多模态数据,构建所述目标用户对应的用户画像。
[0010]根据本申请提供的一种用户画像的构建方法,在所述多模态数据包括所述音频数据的情况下,所述基于所述目标文本数据和所述多模态数据,构建所述目标用户对应的用户画像,包括:
[0011]从所述音频数据中提取所述目标用户的声纹特征。
[0012]对所述目标文本数据和所述声纹特征进行融合处理,并基于融合结果构建目标用户对应的用户画像。
[0013]根据本申请提供的一种用户画像的构建方法,所述方法还包括:
[0014]采用转写算法对所述音频数据进行模态类型转换处理,得到第一转换文本数据,所述第一转换文本数据为所述音频数据对应的换文本数据。
[0015]根据本申请提供的一种用户画像的构建方法,在所述多模态数据包括所述视频数据的情况下,所述基于所述目标文本数据和所述多模态数据,构建所述目标用户对应的用户画像,包括:
[0016]从所述视频数据中提取所述目标用户的体态特征,所述体态特征包括动作特征和
姿态特征。
[0017]对所述目标文本数据和所述体态特征进行融合处理,并基于融合结果构建目标用户对应的用户画像。
[0018]根据本申请提供的一种用户画像的构建方法,所述方法还包括:
[0019]对所述视频数据进行模态类型转换处理,得到所述视频数据对应的第一音频数据和第一图像数据。
[0020]采用转写算法对所述第一音频数据进行模态类型转换处理,得到所述第一音频数据对应的第二转换文本数据;并采用图像分析算法对所述第一图像数据进行模态类型转换处理,得到所述第一图像数据对应的第三转换文本数据,所述第二转换文本数据和所述第三转换文本数据构成所述视频数据对应的转换文本数据。
[0021]根据本申请提供的一种用户画像的构建方法,在所述多模态数据包括所述图像数据的情况下,所述基于所述目标文本数据和所述多模态数据,构建所述目标用户对应的用户画像,包括:
[0022]从所述图像数据中提取所述目标用户的面部表情特征。
[0023]对所述目标文本数据和所述面部表情特征进行融合处理,并基于融合结果构建目标用户对应的用户画像。
[0024]根据本申请提供的一种用户画像的构建方法,所述基于融合结果构建目标用户对应的用户画像,包括:
[0025]采用聚类算法、遗传算法、或者神经网络算法对所述融合结果进行处理,构建所述目标用户对应的用户画像。
[0026]本申请还提供一种用户画像的构建装置,包括:
[0027]获取单元,用于获取目标用户对应的多模态数据,所述多模态数据包括音频数据、视频数据、图像数据或者文本数据中的至少两种。
[0028]处理单元,用于确定所述多模态数据对应的目标文本数据,所述目标文本数据包括所述多模态数据中非文本数据转换后得到的转换文本数据,或者,所述目标文本数据包括所述转换文本数据和所述文本数据。
[0029]构建单元,用于基于所述目标文本数据和所述多模态数据,构建所述目标用户对应的用户画像。
[0030]根据本申请提供的一种用户画像的构建装置,在所述多模态数据包括所述音频数据的情况下,所述构建单元,具体用于:
[0031]从所述音频数据中提取所述目标用户的声纹特征;对所述目标文本数据和所述声纹特征进行融合处理,并基于融合结果构建目标用户对应的用户画像。
[0032]根据本申请提供的一种用户画像的构建装置,所述处理单元,还用于采用转写算法对所述音频数据进行模态类型转换处理,得到第一转换文本数据,所述第一转换文本数据为所述音频数据对应的换文本数据。
[0033]根据本申请提供的一种用户画像的构建装置,在所述多模态数据包括所述视频数据的情况下,所述构建单元,具体用于:
[0034]从所述视频数据中提取所述目标用户的体态特征,所述体态特征包括动作特征和姿态特征;对所述目标文本数据和所述体态特征进行融合处理,并基于融合结果构建目标
用户对应的用户画像。
[0035]根据本申请提供的一种用户画像的构建装置,所述处理单元,还用于:
[0036]对所述视频数据进行模态类型转换处理,得到所述视频数据对应的第一音频数据和第一图像数据;采用转写算法对所述第一音频数据进行模态类型转换处理,得到所述第一音频数据对应的第二转换文本数据;并采用图像分析算法对所述第一图像数据进行模态类型转换处理,得到所述第一图像数据对应的第三转换文本数据,所述第二转换文本数据和所述第三转换文本数据构成所述视频数据对应的转换文本数据。
[0037]根据本申请提供的一种用户画像的构建装置,在所述多模态数据包括所述图像数据的情况下,所述构建单元,具体用于:
[0038]从所述图像数据中提取所述目标用户的面部表情特征;对所述目标文本数据和所述面部表情特征进行融合处理,并基于融合结果构建目标用户对应的用户画像。
[0039]根据本申请提供的一种用户画像的构建装置,所述构建单元,具体用于:采用聚类算法、遗传算法、或者神经网络算法对所述融合结果进行处理,构建所述目标用户对应的用户画像。
[0040]本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的用户画像的构建方法。
[0041]本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的用户画像的构建方法。
[0042]本申请还提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户画像的构建方法,其特征在于,包括:获取目标用户对应的多模态数据,所述多模态数据包括音频数据、视频数据、图像数据或者文本数据中的至少两种;确定所述多模态数据对应的目标文本数据,所述目标文本数据包括所述多模态数据中非文本数据转换后得到的转换文本数据,或者,所述目标文本数据包括所述转换文本数据和所述文本数据;基于所述目标文本数据和所述多模态数据,构建所述目标用户对应的用户画像。2.根据权利要求1所述的用户画像的构建方法,其特征在于,在所述多模态数据包括所述音频数据的情况下,所述基于所述目标文本数据和所述多模态数据,构建所述目标用户对应的用户画像,包括:从所述音频数据中提取所述目标用户的声纹特征;对所述目标文本数据和所述声纹特征进行融合处理,并基于融合结果构建目标用户对应的用户画像。3.根据权利要求2所述的用户画像的构建方法,其特征在于,所述方法还包括:采用转写算法对所述音频数据进行模态类型转换处理,得到第一转换文本数据,所述第一转换文本数据为所述音频数据对应的换文本数据。4.根据权利要求1

3任一项所述的用户画像的构建方法,其特征在于,在所述多模态数据包括所述视频数据的情况下,所述基于所述目标文本数据和所述多模态数据,构建所述目标用户对应的用户画像,包括:从所述视频数据中提取所述目标用户的体态特征,所述体态特征包括动作特征和姿态特征;对所述目标文本数据和所述体态特征进行融合处理,并基于融合结果构建目标用户对应的用户画像。5.根据权利要求4所述的用户画像的构建方法,其特征在于,所述方法还包括:对所述视频数据进行模态类型转换处理...

【专利技术属性】
技术研发人员:孙哲南张堃博赵晓玲张大朋徐辉杰田栋琦
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1