用户画像生成方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:21159517 阅读:18 留言:0更新日期:2019-05-22 08:03
本公开涉及一种用户画像生成方法、装置、电子设备及计算机可读介质。包括:通过多个数据源获取原始数据;通过分布式大数据平台对所述原始数据进行数据处理,生成用户数据;将所述用户数据输入用户标签模型中,确定用户标签及其对应的权重;以及根据所述用户标签及其对应的权重生成用户画像。本公开涉及的用户画像生成方法、装置、电子设备及计算机可读介质,能够快速准确的生成用户画像,提高产品服务的满意度。

User Portrait Generation Method, Device, Electronic Equipment and Computer Readable Media

The present disclosure relates to a user portrait generation method, device, electronic device and computer readable medium. It includes: obtaining raw data through multiple data sources; processing the raw data through distributed large data platform to generate user data; inputting the user data into the user label model to determine the user label and its corresponding weight; and generating user portraits according to the user label and its corresponding weight. The user portrait generation method, device, electronic device and computer readable medium involved in the present disclosure can quickly and accurately generate user portraits and improve the satisfaction of product and service.

【技术实现步骤摘要】
用户画像生成方法、装置、电子设备及计算机可读介质
本公开涉及计算机信息处理领域,具体而言,涉及一种用户画像生成方法、装置、电子设备及计算机可读介质。
技术介绍
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。目前,用户画像可根据用户的人口属性、偏好习惯和行为信息而抽象出来的标签化画像。目前,国内各大电商都推出了自己的用户画像功能,通过对用户的个体消费能力、消费内容等长时间多频次的建模,为每个客户构建一个精准的消费画像。但是,由于用户画像的构建需要很大的计算量,而现在电商平台面对的是海量的用户数据,如何快速的处理海量数据,获取每一个用户的用户画像是亟待解决的问题。因此,需要一种新的用户画像生成方法、装置、电子设备及计算机可读介质。在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此,本公开提供一种用户画像生成方法、装置、电子设备及计算机可读介质,能够快速准确的生成用户画像,提高产品服务的满意度。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一方面,提出一种用户画像生成方法,该方法包括:通过多个数据源获取原始数据;通过分布式大数据平台对所述原始数据进行数据处理,生成用户数据;将所述用户数据输入用户标签模型中,确定用户标签及其对应的权重;以及根据所述用户标签及其对应的权重生成用户画像。在本公开的一种示例性实施例中,还包括:通过历史用户数据与多卷积神经网络算法生成所述用户标签模型。在本公开的一种示例性实施例中,通过历史用户数据与多卷积神经网络算法生成所述用户标签模型包括:通过多个数据源获取历史用户数据;为每一个历史用户数据均指定其对应的标签,生成标签数据;将历史用户数据与标签数据作为训练数据输入多卷积神经网络算法中,生成所述用户标签模型。在本公开的一种示例性实施例中,通过多个数据源获取原始数包括:通过用户浏览日志获取所述原始数据;和/或通过网络爬虫爬取预定网页数据获取所述原始数据。在本公开的一种示例性实施例中,所述分布式大数据平台包括Hadoop存储平台,hive数据仓库,以及sqoop数据转移工具;通过分布式大数据平台对所述原始数据进行数据处理,生成用户数据还包括:通过sqoop数据转移工具将所述原始数据进行数据转移;通过hive数据仓库对转移后的所述原始数据进行数据清洗生成所述用户数据;以及通过hadoop存储平台存储所述用户数据。在本公开的一种示例性实施例中,将所述用户数据输入用户标签模型中,确定用户标签及其对应的权重包括:将所述用户数据输入所述用户标签模型中;通过用户标签模型中多个卷积层提取所述用户数据中的特征数据;以及通过用户标签模型中的输出层为特征数据确定标签与权重。在本公开的一种示例性实施例中,根据所述用户标签及其对应的权重生成用户画像包括:将用户标签按照其对应的权重进行排序;根据排序结果依次选取预定个用户标签以生成所述用户画像。根据本公开的一方面,提出一种用户画像生成装置,该装置包括:数据模块,用于通过多个数据源获取原始数据;处理模块,用于通过分布式大数据平台对所述原始数据进行数据处理,生成用户数据;标签模块,用于将所述用户数据输入用户标签模型中,确定用户标签及其对应的权重;以及画像模块,用于根据所述用户标签及其对应的权重生成用户画像。根据本公开的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。根据本公开的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。根据本公开的用户画像生成方法、装置、电子设备及计算机可读介质,通过分布式大数据平台对所述原始数据进行数据处理,生成用户数据;将所述用户数据输入用户标签模型中,确定用户标签及其对应的权重的方式,能够快速准确的生成用户画像,提高产品服务的满意度。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的一种用户画像生成方法及装置的系统框图。图2是根据一示例性实施例示出的一种用户画像生成方法的流程图。图3是根据另一示例性实施例示出的一种用户画像生成方法的流程图。图4是根据另一示例性实施例示出的一种用户画像生成方法的示意图。图5是根据一示例性实施例示出的一种用户画像生成装置的框图。图6是根据另一示例性实施例示出的一种用户画像生成装置的框图。图7是根据一示例性实施例示出的一种电子设备的框图。图8是根据一示例性实施例示出一种计算机可读存储介质示意图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。图1是根据一示例性实施例示出的一种用户画像生成方法及装置的系统框本文档来自技高网...

【技术保护点】
1.一种用户画像生成方法,其特征在于,包括:通过多个数据源获取原始数据;通过分布式大数据平台对所述原始数据进行数据处理,生成用户数据;将所述用户数据输入用户标签模型中,确定用户标签及其对应的权重;以及根据所述用户标签及其对应的权重生成用户画像。

【技术特征摘要】
1.一种用户画像生成方法,其特征在于,包括:通过多个数据源获取原始数据;通过分布式大数据平台对所述原始数据进行数据处理,生成用户数据;将所述用户数据输入用户标签模型中,确定用户标签及其对应的权重;以及根据所述用户标签及其对应的权重生成用户画像。2.如权利要求1所述的方法,其特征在于,还包括:通过历史用户数据与多卷积神经网络算法生成所述用户标签模型。3.如权利要求1所述的方法,其特征在于,通过历史用户数据与多卷积神经网络算法生成所述用户标签模型包括:通过多个数据源获取历史用户数据;为每一个历史用户数据均指定其对应的标签,生成标签数据;将历史用户数据与标签数据作为训练数据输入多卷积神经网络算法中,生成所述用户标签模型。4.如权利要求1所述的方法,其特征在于,通过多个数据源获取原始数包括:通过用户浏览日志获取所述原始数据;和/或通过网络爬虫爬取预定网页数据获取所述原始数据。5.如权利要求1所述的方法,其特征在于,所述分布式大数据平台包括Hadoop存储平台,hive数据仓库,以及sqoop数据转移工具;通过分布式大数据平台对所述原始数据进行数据处理,生成用户数据还包括:通过sqoop数据转移工具将所述原始数据进行数据转移;通过hive数据仓库对转移后的所述原始数据进行数据清洗生成所述用户数据...

【专利技术属性】
技术研发人员:徐涛吴楠武永宽贺斌王春捷
申请(专利权)人:北京码牛科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1