基于大数据的用户画像构造方法、装置及计算设备制造方法及图纸

技术编号:17346420 阅读:34 留言:0更新日期:2018-02-25 11:41
本发明专利技术公开了一种基于大数据的用户画像构造方法、装置、计算设备及计算机存储介质。其中方法包括:获取用户操作应用程序的行为信息和用户终端已安装的应用程序的列表信息;利用第一深度学习算法对行为信息进行学习,得到用户行为特征向量;利用第二深度学习算法对用户终端已安装的应用程序的列表信息进行学习,得到用户终端已安装的应用程序的应用程序特征向量;基于用户行为特征向量和应用程序特征向量构造用户画像。本发明专利技术提供的技术方案,基于大数据构造的用户画像能够充分反映用户的特征,从而能够根据用户画像为用户提供更精细化服务,克服了现有技术中仅依赖用户的一元数据,例如,年龄、性别等构造用户画像导致的用户画像质量低的缺陷。

【技术实现步骤摘要】
基于大数据的用户画像构造方法、装置及计算设备
本专利技术涉及数据处理
,具体涉及一种基于大数据的用户画像构造方法、装置、计算设备及计算机存储介质。
技术介绍
随着网络和信息技术的不断发展,各类平台应用而生,为了改善平台的各项功能,以方便平台为用户提供更好的服务,以及保护平台的利益,需要了解、分析用户的各项信息。目前,常通过构建用户画像的方式来了解用户的信息。现有的用户画像构建方法,主要是根据用户的一元数据,例如,性别、年龄、职业、星座、身高、体重、购物类型、品牌偏好和/或收入等来构造用户画像,并未充分利用因互联网而产生的大数据,虽然利用一元数据所构造的用户画像能够对平台予以指导,但是并不能充分体现用户的特征,从而使得平台无法为用户提供精细化的服务,也无法在用户存在欺诈等行为时对保护平台利益。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的基于大数据的用户画像构造方法、装置、计算设备及计算机存储介质。根据本专利技术的一个方面,提供了一种基于大数据的用户画像构造方法,包括:获取用户操作应用程序的行为信息和用户终端已安装的应用程序的列表信息;利用第一深度学习算法对行为信息进行学习,得到用户行为特征向量;利用第二深度学习算法对用户终端已安装的应用程序的列表信息进行学习,得到用户终端已安装的应用程序的应用程序特征向量;基于用户行为特征向量和应用程序特征向量构造用户画像。可选地,利用第一深度学习算法对行为信息进行学习,得到用户行为特征向量进一步包括:根据行为信息得到用户操作应用程序的行为轨迹;根据用户操作应用程序的行为轨迹,生成行为序列;利用经过训练的时间递归神经网络对行为序列进行序列学习,得到用户行为特征向量。可选地,利用第二深度学习算法对用户终端已安装的应用程序的列表信息进行学习,得到用户终端已安装的应用程序的应用程序特征向量进一步包括:利用经过训练的嵌入模型对用户终端已安装的应用程序的列表信息中每个应用程序进行学习,得到每个应用程序对应的应用程序特征向量;利用预设算法多个应用程序的应用程序特征向量进行运算处理,得到用户终端已安装的应用程序的应用程序特征向量。可选地,在构造用户画像之后,方法还包括:基于用户画像样本训练用户兴趣爱好模型;将待分析用户的用户画像输入至用户兴趣爱好模型进行分析,得到该用户的兴趣爱好。可选地,在构造用户画像之后,方法还包括:基于用户画像分析用户是否具有异常行为。可选地,行为信息包括:用户对应用程序的操作以及在应用程序的页面停留时间。根据本专利技术的另一方面,提供了一种基于大数据的用户画像构造装置,包括:获取模块,适于获取用户操作应用程序的行为信息和用户终端已安装的应用程序的列表信息;第一学习模块,适于利用第一深度学习算法对行为信息进行学习,得到用户行为特征向量;第二学习模块,适于利用第二深度学习算法对用户终端已安装的应用程序的列表信息进行学习,得到用户终端已安装的应用程序的应用程序特征向量;用户画像构造模块,适于基于用户行为特征向量和应用程序特征向量构造用户画像。可选地,第一学习模块进一步包括:行为轨迹生成单元,适于根据行为信息得到用户操作应用程序的行为轨迹;行为序列生成单元,适于根据用户操作应用程序的行为轨迹,生成行为序列;第一学习单元,适于利用经过训练的时间递归神经网络对行为序列进行序列学习,得到用户行为特征向量。可选地,第二学习模块进一步包括:第二学习单元,适于利用经过训练的嵌入模型对用户终端已安装的应用程序的列表信息中每个应用程序进行学习,得到每个应用程序对应的应用程序特征向量;运算处理单元,适于利用预设算法多个应用程序的应用程序特征向量进行运算处理,得到用户终端已安装的应用程序的应用程序特征向量。可选地,装置还包括:训练模块,适于基于用户画像样本训练用户兴趣爱好模型;兴趣爱好分析模块,适于将待分析用户的用户画像输入至用户兴趣爱好模型进行分析,得到该用户的兴趣爱好。可选地,装置还包括:异常行为分析模块,适于基于用户画像分析用户是否具有异常行为。可选地,行为信息包括:用户对应用程序的操作以及在应用程序的页面停留时间。根据本专利技术的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行上述基于大数据的用户画像构造方法对应的操作。根据本专利技术的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述基于大数据的用户画像构造方法对应的操作。根据本专利技术提供的方案,获取用户操作应用程序的行为信息和用户终端已安装的应用程序的列表信息,利用第一深度学习算法对行为信息进行学习,得到用户行为特征向量,利用第二深度学习算法对用户终端已安装的应用程序的列表信息进行学习,得到用户终端已安装的应用程序的应用程序特征向量,基于用户行为特征向量和应用程序特征向量构造用户画像。本专利技术提供的技术方案,基于大数据构造的用户画像能够充分反映用户的特征,从而能够方便地根据用户画像为用户提供更精细化服务,克服了现有技术中仅依赖用户的一元数据,例如,年龄、性别、收入等构造用户画像而导致的用户画像质量低的缺陷。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的基于大数据的用户画像构造方法的流程示意图;图2示出了根据本专利技术另一个实施例的基于大数据的用户画像构造方法的流程示意图;图3示出了根据本专利技术一个实施例的基于大数据的用户画像构造装置的结构程示意图;图4示出了根据本专利技术另一个实施例的基于大数据的用户画像构造装置的结构程示意图;图5示出了根据本专利技术一个实施例的一种计算设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了根据本专利技术一个实施例的基于大数据的用户画像构造方法的流程示意图。如图1所示,该方法包括以下步骤:步骤S100,获取用户操作应用程序的行为信息和用户终端已安装的应用程序的列表信息。用户操作应用程序的行为信息指用户对应用程序进行操作时所产生的行为信息,这里的行为信息不仅包含具体的操作还包括在应用程序的页面所停留时间,根据用户操作应用程序的行为信息可以分析用户的行为是否友好,以及分析用户所关注的信息。用户终端已安装的应用程序的列表信息记录了用户终端已安装的应用程序,用户终端已安装的应用程序是用户兴趣、需求等的一种侧面体现,根据用户终端已安装的应用程序的列表信息来构造用户画像,能本文档来自技高网...
基于大数据的用户画像构造方法、装置及计算设备

【技术保护点】
一种基于大数据的用户画像构造方法,包括:获取用户操作应用程序的行为信息和用户终端已安装的应用程序的列表信息;利用第一深度学习算法对所述行为信息进行学习,得到用户行为特征向量;利用第二深度学习算法对所述用户终端已安装的应用程序的列表信息进行学习,得到用户终端已安装的应用程序的应用程序特征向量;基于所述用户行为特征向量和所述应用程序特征向量构造用户画像。

【技术特征摘要】
1.一种基于大数据的用户画像构造方法,包括:获取用户操作应用程序的行为信息和用户终端已安装的应用程序的列表信息;利用第一深度学习算法对所述行为信息进行学习,得到用户行为特征向量;利用第二深度学习算法对所述用户终端已安装的应用程序的列表信息进行学习,得到用户终端已安装的应用程序的应用程序特征向量;基于所述用户行为特征向量和所述应用程序特征向量构造用户画像。2.根据权利要求1所述的方法,其中,所述利用第一深度学习算法对所述行为信息进行学习,得到用户行为特征向量进一步包括:根据所述行为信息得到用户操作应用程序的行为轨迹;根据用户操作应用程序的行为轨迹,生成行为序列;利用经过训练的时间递归神经网络对所述行为序列进行序列学习,得到用户行为特征向量。3.根据权利要求1或2所述的方法,其中,所述利用第二深度学习算法对所述用户终端已安装的应用程序的列表信息进行学习,得到用户终端已安装的应用程序的应用程序特征向量进一步包括:利用经过训练的嵌入模型对所述用户终端已安装的应用程序的列表信息中每个应用程序进行学习,得到每个应用程序对应的应用程序特征向量;利用预设算法多个应用程序的应用程序特征向量进行运算处理,得到用户终端已安装的应用程序的应用程序特征向量。4.根据权利要求1-3任一项所述的方法,其中,在构造用户画像之后,所述方法还包括:基于所述用户画像样本训练用户兴趣爱好模型;将待分析用户的用户画像输入至用户兴趣爱好模型进行分析,得到该用户的兴趣爱好。5.根据权利要求1-3任一项所述的方法,其中,在构造用户画像之后,所述方...

【专利技术属性】
技术研发人员:董健
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1