The embodiment of the present invention proposes a user portrait construction method, device, terminal and computer readable storage medium. The method includes: selecting multiple existing tags from external data sources as selected tag sets; obtaining media object sets corresponding to selected media from user data sources; obtaining external object sets corresponding to media object sets from external data sources; and Each external object in the part object set contains the selected label set. Using the selected label set of each external object, the user behavior data is processed and the user portrait is constructed. The embodiment of the invention can quickly construct user-specific user portraits by combining user behavior data with existing tags in external data sources.
【技术实现步骤摘要】
用户画像构建方法、装置、终端和计算机可读存储介质
本专利技术涉及大数据
,尤其涉及一种用户画像构建方法、装置、终端和计算机可读存储介质。
技术介绍
随着人工智能的发展,各行各业都有了数据意识,希望能够利用数据储备构建用户画像以支撑业务的精细化经营。但是现有的用户画像构建技术均存在以下方面的缺陷:各标签构建过程基本独立,模型复用率低,缺少通用方案。随着用户画像中要构建的标签增多,相关边际成本提高。标签种类严格受业务数据特性约束。由于过度依赖于人对业务的解读,往往只能发现数据的显性关系,从而限制可挖掘的标签种类。标签模型构建技术门槛高,传统的标签模型是构建在数据的广泛采集、大数据、人工智能计算平台以及大规模机器学习专家团队的基础上的。模型维护成本高,随着用户行为习惯和特征的变化,过去的经验不再准确或者不再适用,模型可能需要长期维护和更新。在
技术介绍
中公开的上述信息仅用于加强对本专利技术的背景的理解,因此其可能包含没有形成为本领域普通技术人员所知晓的现有技术的信息。
技术实现思路
本专利技术实施例提供一种用户画像构建方法、装置、终端和计算机可读存储介质,以解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种用户画像构建方法,包括:从外部数据源中选取多个已有标签作为选定标签集合;从用户数据源中获取与选定媒介对应的媒介对象集合;从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。结合第一方面,本专利技术实施例 ...
【技术保护点】
1.一种用户画像构建方法,其特征在于,包括:从外部数据源中选取多个已有标签作为选定标签集合;从用户数据源中获取与选定媒介对应的媒介对象集合;从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。
【技术特征摘要】
1.一种用户画像构建方法,其特征在于,包括:从外部数据源中选取多个已有标签作为选定标签集合;从用户数据源中获取与选定媒介对应的媒介对象集合;从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。2.如权利要求1所述的方法,其特征在于,利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像,包括:利用各所述外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合所述用户行为数据进行计算;将各所述外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签;将所述用户的所有画像标签聚合,形成所述用户画像。3.如权利要求1所述的方法,其特征在于,从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合,包括:若所述外部数据源为多个,则从多个所述外部数据源中分别获取与所述媒介对象集合相对应的外部对象集合;将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。4.如权利要求3所述的方法,其特征在于,将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合,包括:将所述相同的外部对象的选定标签集合中的相同标签进行加权,生成一个加权的选定标签;将各所述加权的选定标签聚合,形成所述聚合的选定标签集合。5.如权利要求1所述的方法,其特征在于,还包括:从所述用户数据源中获取最新的用户行为数据;利用各所述外部对象的选定标签集合,对所述最新的用户行为数据进行处理,以更新用户画像。6.一种用户画像构建装置,其特征在于,...
【专利技术属性】
技术研发人员:史源,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。