一种用户兴趣识别方法及装置制造方法及图纸

技术编号:23288260 阅读:19 留言:0更新日期:2020-02-08 18:16
本发明专利技术公开了一种用户兴趣识别方法及装置,属于深度学习技术领域。所述方法包括:将包含用户APP时序信息的APP列表数据,输入神经网络识别模型,通过所述神经网络识别模型进行包含加权聚合的计算,输出用户兴趣识别结果,其中,所述神经网络识别模型是通过输入包含用户APP时序信息的APP列表训练数据训练得到的。本发明专利技术解决了现有技术因忽略用户APP时序信息而造成的模型预测不准确问题,获取了跟用户兴趣有关的更丰富语义信息,提高了用户兴趣识别的准确度。

A method and device of user interest identification

【技术实现步骤摘要】
一种用户兴趣识别方法及装置
本专利技术涉及深度学习
,特别涉及一种用户兴趣识别方法及装置。
技术介绍
对于用于刻画用户兴趣偏好的机器学习模型而言,传统做法如图1所示,直接将所有APP放在一起学习,通过网络得到APP的向量表示参数,不考虑时序信息,每个APP之间相互独立,只是静态地去统计用户历史上使用过哪些类型的APP作为特征变量使用,而在短时间内用户的行为偏好往往会发生变化,却会被当做噪音,干扰信息,造成模型预测不准确。因此在建模过程中,需要考虑时序信息,捕获用户长期稳定的兴趣与短期突变的爱好。例如,在网络营销、推荐、风控的大数据应用场景中,为了更好的满足用户的体验,用户常常主动授权服务商获取其移动设备中安装的APP安装列表信息,用于评估用户的兴趣偏好,结合实际业务场景,给用户更精准的推荐,更高的信用额度等。通过数据分析发现,用户的兴趣偏好会随着时间的推移而发生变化,例如,对于一个喜欢音乐的用户,在求职招聘期间,会集中下载很多招聘类的APP,当用户入职后,该类APP会被删除,而音乐类的APP却不会轻易被卸载。此外,当前的应用市场上存在几百万个APP,每个APP下载渠道提供的APP描述信息,APP的类别信息等会存在差异,而且应用市场上,每天都在新增新的APP应用,人工去整理归类这些信息对于服务商而言需要投入巨大的成本,因此需要利用机器学习模型,自动地去提取APP的语义信息,以便实现用户兴趣识别。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种用户兴趣识别方法及装置,解决了现有技术因忽略用户APP时序信息而造成的模型预测不准确问题,获取了跟用户兴趣有关的更丰富语义信息,提高了用户兴趣识别的准确度。所述技术方案如下:一方面,提供了一种用户兴趣识别方法,所述方法包括:将包含用户APP时序信息的APP列表数据,输入神经网络识别模型,通过所述神经网络识别模型进行包含加权聚合的计算,输出用户兴趣识别结果,其中,所述神经网络识别模型是通过输入包含用户APP时序信息的APP列表训练数据训练得到的。进一步地,所述神经网络识别模型通过以下方式训练得到:将包含用户APP时序信息的APP列表训练数据输入预设神经网络识别模型,生成APP向量数据;对所述APP向量数据进行加权聚合;利用预设多层感知机算法继续进行训练,获得所述神经网络识别模型。进一步地,对所述APP向量数据进行加权聚合之前,分别计算每个用户的每个APP权重,从而获取多个用户的各自APP权重数据。进一步地,分别计算每个用户的每个APP权重,从而获取多个用户的各自APP权重数据,包括:分别将APP向量数据中的两个原始embedding向量进行两两点乘,得到N维交互向量,然后分别将所述两个原始embedding向量和所述N维交互向量,拼接成3N维输入向量,计算得到所述多个用户的各自APP权重数据,其中N为大于1的整数。进一步地,所述方法还包括:获取APP列表数据,根据安装人数对所述APP列表数据进行清洗,去除其中的低频APP,然后对所有APP进行标注,获取APP各自编号;获取多个用户不同时刻的相应APP信息,基于所述APP各自编号,分别对每一用户以及该用户不同时刻的相应APP信息进行标注,获得包含用户APP时序信息的APP列表数据。进一步地,所述加权聚合包括:依次对后一时刻APP向量权重与前一时刻APP向量权重,加权得到权重w21、w22、w23、…、w2n、w2(n+1),再依次将每一时刻APP向量权重与前面所有时刻APP向量权重进行聚合,获得每一时刻的聚合向量,再将所述每一时刻的聚合向量求和或求均值,其中,n为大于1的整数。另一方面,提供了一种用户兴趣识别装置,所述装置包括模型识别模块,所述模型识别模块用于:将包含用户APP时序信息的APP列表数据,输入神经网络识别模型,通过所述神经网络识别模型进行包含加权聚合的计算,输出用户兴趣识别结果,其中,所述神经网络识别模型是通过输入包含用户APP时序信息的APP列表训练数据训练得到的。进一步地,所述装置还包括模型训练模块,所述模型训练模块包括向量生成子模块、加权聚合子模块和MLP子模块,所述向量生成子模块将包含用户APP时序信息的APP列表训练数据输入预设神经网络识别模型,生成APP向量数据;加权聚合子模块对所述APP向量数据进行加权聚合;所述MLP子模块利用预设多层感知机算法继续进行训练,获得所述神经网络识别模型。进一步地,所述模型训练模块还包括权重计算子模块,所述权重计算子模块用于:对所述APP向量数据进行加权聚合之前,分别将APP向量数据中的两个原始embedding向量进行两两点乘,得到N维交互向量,然后分别将所述两个原始embedding向量和所述N维交互向量,拼接成3N维输入向量,计算得到所述多个用户的各自APP权重数据,其中N为大于1的整数。进一步地,所述加权聚合包括:依次对后一时刻APP向量权重与前一时刻APP向量权重,加权得到权重w21、w22、w23、…、w2n、w2(n+1),再依次将每一时刻APP向量权重与前面所有时刻APP向量权重进行聚合,获得每一时刻的聚合向量,再将所述每一时刻的聚合向量求和或求均值,其中,n为大于1的整数。本专利技术实施例提供的技术方案带来的有益效果是:利用神经网络识别模型,通过融合时序信息的APP语义特征提取方案,获得包含时序行为动作信息的APP低维度向量以及其他语义更丰富的识别结果,由于考虑充分考虑了APP动态时序信息,并通过加权聚合操作在识别过程中融合不同APP之间的交互信息,可以动态地计算用户长期兴趣与短期兴趣,提高了用户兴趣识别的准确率,并且自动获取的APP低维度向量,也可以作为其他深度学习或后续应用(如聚类、相似度计算)的输入数据。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是现有技术中一种通过机器学习模型进行用户兴趣识别的流程图;图2是本专利技术实施例提供的用户兴趣识别方法流程图;图3是一优选实施方式的神经网络识别模型训练流程示意图;图4是一优选方式的用户兴趣识别方法流程示意图;图5是一优选实施例提供的用户兴趣识别方法中神经网络模型主网络框架图;图6是图5中加权聚合子网络框架图;图7是本专利技术实施例提供的用户兴趣识别装置结构示意图;图8是一优选实施方式的户兴趣识别装置结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的本文档来自技高网...

【技术保护点】
1.一种用户兴趣识别方法,其特征在于,所述方法包括:/n将包含用户APP时序信息的APP列表数据,输入神经网络识别模型,通过所述神经网络识别模型进行包含加权聚合的计算,输出用户兴趣识别结果,其中,所述神经网络识别模型是通过输入包含用户APP时序信息的APP列表训练数据训练得到的。/n

【技术特征摘要】
1.一种用户兴趣识别方法,其特征在于,所述方法包括:
将包含用户APP时序信息的APP列表数据,输入神经网络识别模型,通过所述神经网络识别模型进行包含加权聚合的计算,输出用户兴趣识别结果,其中,所述神经网络识别模型是通过输入包含用户APP时序信息的APP列表训练数据训练得到的。


2.根据权利要求1所述的方法,其特征在于,所述神经网络识别模型通过以下方式训练得到:
将包含用户APP时序信息的APP列表训练数据输入预设神经网络识别模型,生成APP向量数据;
对所述APP向量数据进行加权聚合;
利用预设多层感知机算法继续进行训练,获得所述神经网络识别模型。


3.根据权利要求2所述的方法,其特征在于,对所述APP向量数据进行加权聚合之前,分别计算每个用户的每个APP权重,从而获取多个用户的各自APP权重数据。


4.根据权利要求3所述的方法,其特征在于,分别计算每个用户的每个APP权重,从而获取多个用户的各自APP权重数据,包括:
分别将APP向量数据中的两个原始embedding向量进行两两点乘,得到N维交互向量,然后分别将所述两个原始embedding向量和所述N维交互向量,拼接成3N维输入向量,计算得到所述多个用户的各自APP权重数据,其中N为大于1的整数。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取APP列表数据,根据安装人数对所述APP列表数据进行清洗,去除其中的低频APP,然后对所有APP进行标注,获取APP各自编号;
获取多个用户不同时刻的相应APP信息,基于所述APP各自编号,分别对每一用户以及该用户不同时刻的相应APP信息进行标注,获得包含用户APP时序信息的APP列表数据。


6.根据权利要求1至5任一项所述的方法,其特征在于,所述加权聚合包括:
依次对后一时刻APP向量权重与前一时刻APP向量权重,加权得...

【专利技术属性】
技术研发人员:李君浩李铁铮
申请(专利权)人:上海上湖信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1