用户画像构建方法、装置、终端和计算机可读存储介质制造方法及图纸

技术编号:20117615 阅读:64 留言:0更新日期:2019-01-16 12:02
本发明专利技术实施例提出一种用户画像构建方法、装置、终端和计算机可读存储介质,方法包括:从外部数据源中选取多个已有标签作为选定标签集合;从用户数据源中获取与选定媒介对应的媒介对象集合;从外部数据源中获取与媒介对象集合相对应的外部对象集合,外部对象集合中的每一个外部对象包含选定标签集合;利用各外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。本发明专利技术实施例能够通过外部数据源中已有的标签,结合用户行为数据,快速构建用户专属的用户画像。

User Portrait Construction Method, Device, Terminal and Computer Readable Storage Media

The embodiment of the present invention proposes a user portrait construction method, device, terminal and computer readable storage medium. The method includes: selecting multiple existing tags from external data sources as selected tag sets; obtaining media object sets corresponding to selected media from user data sources; obtaining external object sets corresponding to media object sets from external data sources; and Each external object in the part object set contains the selected label set. Using the selected label set of each external object, the user behavior data is processed and the user portrait is constructed. The embodiment of the invention can quickly construct user-specific user portraits by combining user behavior data with existing tags in external data sources.

【技术实现步骤摘要】
用户画像构建方法、装置、终端和计算机可读存储介质
本专利技术涉及大数据
,尤其涉及一种用户画像构建方法、装置、终端和计算机可读存储介质。
技术介绍
随着人工智能的发展,各行各业都有了数据意识,希望能够利用数据储备构建用户画像以支撑业务的精细化经营。但是现有的用户画像构建技术均存在以下方面的缺陷:各标签构建过程基本独立,模型复用率低,缺少通用方案。随着用户画像中要构建的标签增多,相关边际成本提高。标签种类严格受业务数据特性约束。由于过度依赖于人对业务的解读,往往只能发现数据的显性关系,从而限制可挖掘的标签种类。标签模型构建技术门槛高,传统的标签模型是构建在数据的广泛采集、大数据、人工智能计算平台以及大规模机器学习专家团队的基础上的。模型维护成本高,随着用户行为习惯和特征的变化,过去的经验不再准确或者不再适用,模型可能需要长期维护和更新。在
技术介绍
中公开的上述信息仅用于加强对本专利技术的背景的理解,因此其可能包含没有形成为本领域普通技术人员所知晓的现有技术的信息。
技术实现思路
本专利技术实施例提供一种用户画像构建方法、装置、终端和计算机可读存储介质,以解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种用户画像构建方法,包括:从外部数据源中选取多个已有标签作为选定标签集合;从用户数据源中获取与选定媒介对应的媒介对象集合;从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。结合第一方面,本专利技术实施例在第一方面的第一种实现方式中,利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像,包括:利用各所述外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合所述用户行为数据进行计算;将各所述外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签;将所述用户的所有画像标签聚合,形成所述用户画像。结合第一方面,本专利技术实施例在第一方面的第二种实现方式中,从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合,包括:若所述外部数据源为多个,则从多个所述外部数据源中分别获取与所述媒介对象集合相对应的外部对象集合;将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。结合第一方面的第二种实现方式,本专利技术实施例在第一方面的第三种实现方式中,将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合,包括:将所述相同的外部对象的选定标签集合中的相同标签进行加权,生成一个加权的选定标签;将各所述加权的选定标签聚合,形成所述聚合的选定标签集合。结合第一方面,本专利技术实施例在第一方面的第四种实现方式中,还包括:从所述用户数据源中获取最新的用户行为数据;利用各所述外部对象的选定标签集合,对所述最新的用户行为数据进行处理,以更新用户画像。第二方面,本专利技术实施例提供了一种用户画像构建装置,包括:标签选取模块,用于从外部数据源中选取多个已有标签作为选定标签集合;第一获取模块,用于从用户数据源中获取与选定媒介对应的媒介对象集合;第二获取模块,用于从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;用户画像模块,用于利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。在一个可能的设计中,用户画像模块包括:计算子模块,用于利用各所述外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合所述用户行为数据进行计算;加权子模块,用于将各所述外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签;第一聚合子模块,用于将所述用户的所有画像标签聚合,形成所述用户画像。在一个可能的设计中,第二获取模块包括:获取子模块,用于若所述外部数据源为多个,则从多个所述外部数据源中分别获取与所述媒介对象集合相对应的外部对象集合;第二聚合子模块,用于将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。在一个可能的设计中,还包括:更新模块,用于从所述用户数据源中获取最新的用户行为数据;利用各所述外部对象的选定标签集合,对所述最新的用户行为数据进行处理,以更新用户画像。第三方面,本专利技术实施例提供了一种用户画像构建的终端,包括:所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,用户画像构建的终端的结构中包括处理器和存储器,所述存储器用于存储支持用户画像构建的终端执行上述第一方面中用户画像构建的方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。用户画像构建的终端还可以包括通信接口,用于用户画像构建的终端与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储用户画像构建的终端所用的计算机软件指令,其包括用于执行上述第一方面中用户画像构建的方法为用户画像构建的终端所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:本专利技术实施例能够通过外部数据源中已有的标签,结合用户行为数据,快速构建用户专属的用户画像。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施方式提供的用户画像构建方法的流程图。图2为本专利技术实施方式提供的用户画像构建方法的步骤S400的流程图。图3为本专利技术实施方式提供的性别标签构建框图。图4为本专利技术实施方式提供的用户画像构建方法的步骤S300的流程图。图5为本专利技术实施方式提供的用户画像构建方法的步骤S320的流程图。图6为本专利技术另一实施方式提供的用户画像构建方法的流程图。图7为本专利技术一个应用实例的用户画像构建框图。图8为本专利技术实施方式提供的用户画像构建装置的结构框图。图9为本专利技术实施方式提供的用户画像模块的结构框图。图10为本专利技术实施方式提供的第二获取模块的结构框图。图11为本专利技术另一实施方式提供的用户画像构建装置的结构框图。图12为本专利技术实施方式提供的用户画像构建终端的示意图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。本专利技术实施例提供了一种用户画像构建方法,如图1所示,包括以下步骤:S100:从外部数据源中选取多个已有标签作为选定标签集合。外部数据源可以包括任意已开放的数据源或是合法采集的数据源。外部数据源中存储有若干的标签,没有标签具有对应的标签模型。可根本文档来自技高网...

【技术保护点】
1.一种用户画像构建方法,其特征在于,包括:从外部数据源中选取多个已有标签作为选定标签集合;从用户数据源中获取与选定媒介对应的媒介对象集合;从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。

【技术特征摘要】
1.一种用户画像构建方法,其特征在于,包括:从外部数据源中选取多个已有标签作为选定标签集合;从用户数据源中获取与选定媒介对应的媒介对象集合;从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。2.如权利要求1所述的方法,其特征在于,利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像,包括:利用各所述外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合所述用户行为数据进行计算;将各所述外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签;将所述用户的所有画像标签聚合,形成所述用户画像。3.如权利要求1所述的方法,其特征在于,从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合,包括:若所述外部数据源为多个,则从多个所述外部数据源中分别获取与所述媒介对象集合相对应的外部对象集合;将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。4.如权利要求3所述的方法,其特征在于,将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合,包括:将所述相同的外部对象的选定标签集合中的相同标签进行加权,生成一个加权的选定标签;将各所述加权的选定标签聚合,形成所述聚合的选定标签集合。5.如权利要求1所述的方法,其特征在于,还包括:从所述用户数据源中获取最新的用户行为数据;利用各所述外部对象的选定标签集合,对所述最新的用户行为数据进行处理,以更新用户画像。6.一种用户画像构建装置,其特征在于,...

【专利技术属性】
技术研发人员:史源
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1