一种用户兴趣分析与抽取方法技术

技术编号：37367137 阅读：11 留言：0更新日期：2023-04-27 07:13

本发明专利技术公开了一种用户兴趣分析与抽取方法，通过运用用户历史行为日志和两层注意力层来进行用户兴趣的抽取。具体来说在用户历史行为中加入用户对每个物品的具体行为，将用户基本信息，用户历史行为序列，候选物品进行嵌入，得到每个特征的特征向量；把这些特征拼接，用户历史行为序列中的物品和候选物品通过物品注意力层得到物品加权向量，得到的向量再和具体行为通过行为注意力层，得到用户兴趣的表示；最后所有向量进行拼接，馈入后面的MLP网络，输出用户对候选物品的兴趣等级。本发明专利技术主要解决的问题是对学习者隐式兴趣的发现。要解决的问题是对学习者隐式兴趣的发现。要解决的问题是对学习者隐式兴趣的发现。

全部详细技术资料下载

【技术实现步骤摘要】
一种用户兴趣分析与抽取方法

[0001]本专利技术涉及推荐系统和教育领域，特别是涉及一种用户兴趣分析与抽取方法。

技术介绍

[0002]一个用户在浏览一个学习网站的时候，网站会获得这个用户的显式行为和隐式行为。显式行为就是这个用户明确表示了自己对某个学习资源的喜好程度，而隐式行为只是用户对学习资源进行的操作，而没有直接表达出对这个学习资源的喜好程度。比如一个用户对某篇论文进行了检索、浏览并下载。根据用户的隐式行为获得的用户对学习资源的喜好程度就是用户的隐式兴趣。
[0003]在推荐系统中，为了使推荐结果满足用户个性化的需要，需要对用户画像进行建模，从而分析用户行为习惯、兴趣偏好等重要信息。在学习资源推荐系统中，需要对学习者进行建模，根据学习者的基础信息、学习能力、隐式兴趣等数据归纳出学习者模型。一般来说，学习者不会直接表达出对某个学习资源的喜好程度，所以通过学习者的行为信息，也就是历史行为序列来获取学习者对学习资源的隐式兴趣是很有必要的。
[0004]许多推荐模型，例如WDL和PNN，都使用深度学习方法来提取项目级特征和特征交互。但是，这些模型不考虑通过历史行为来捕获用户兴趣。随着注意力机制在计算机视觉和自然语言处理中取得巨大成功，研究者们把注意力机制运用到了推荐系统中。深度兴趣网络(DIN)是推荐系统中使用注意力机制的第一项工作，它指示用户兴趣的多样性，并使用注意力机制来激活有关候选物品的历史行为。
[0005]但是，DIN模型只考虑了给定的候选物品和用户历史行为序列之间的相关性，却忽略了用...

【技术保护点】

【技术特征摘要】
1.一种用户兴趣分析与抽取方法，其特征在于，包括：在用户历史行为中加入用户对每个物品的具体行为，加入一层行为注意力层来计算这些具体行为对用户兴趣的影响，把得到的用户兴趣表示向量馈入MLP网络，来获取用户对候选物品的兴趣等级。2.根据权利要求1所述的一种用户兴趣分析与抽取方法，其特征在于，具体的包括以下步骤：(1)、输入和嵌入在输入层的部分，输入特征分为三大类，即：用户的基本信息、用户的行为序列和候选商品；将上述三种序列通过嵌入层使这三种序列分别变为一个向量，继而将在用户行为中的物品及用户行为序列通过行为注意力层后，得到物品和行为的加权向量；(2)、用户兴趣获取再将物品和行为的加权向量及候选物品经过物品注意力层，加权求和后得到用户的兴趣表示；(3)、MLP特征交互学习将得到的用户兴趣表示向量馈入MLP网络，充分交叉这些特征，输出用户对候选物品的兴趣级别，来验证用户兴趣抽取的准确性。3.根据权利要求2所述的一种用户兴趣分析与抽取方法，其特征在于，步骤(1)具体包括：用户的基本信息是用户本身的特征；用户的行为序列是用户对一系列物品的历史行为，在行为序列中，每一个物品都有基本特征；候选物品是通过召回得来的物品，每一个候选物品都有基本特征；模型的任务预测用户对候选物品的行为；用嵌入层将其转化为低维稠密的向量，模型的三类输入通过嵌入层后，每一种特征都变成一个低维的向量，把同一个单位的所有特征进行拼接，得到一个向量；把用户的基本信息的用户ID、年龄等特征向量拼接成一个向量，得到一个1*nd的向量，n是特征的个数，d是嵌入的维度；把用户的行为序列的中每个物品的所有特征拼接成一个向量，得到一个1*k*nd的向量，k是用户行为序列的长度，n是特征的个数，d是嵌入的维度；把候选物品的所有特征拼接成一个向量，得到一个1*nd的向量，n是特征的个数，d是嵌入的维度。4.根据权利要求2所述的一种用户兴趣分析与抽取方法，其特征在于，步骤(2)具体包括：户兴趣获取模块包括两层注意力层，分别是物...

【专利技术属性】
技术研发人员：汤世平，邓涵洋，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人