一种捕捉用户即时兴趣的方法及系统技术方案

技术编号：26890940 阅读：42 留言：0更新日期：2020-12-29 16:08

本发明专利技术实施例提供一种捕捉用户即时兴趣的方法及系统，包括：实时监控网站中各用户对物料的刷新情况，当监控到用户对物料进行刷新时，形成用户反馈信息；当接收到任一用户发起的刷新请求或者需要向该用户推送与其兴趣相匹配的物料时，根据该用户的用户ID从Redis中查询并获取预设时间段内该用户对应的用户反馈信息，所述预设时间段包括当前时间；根据获取到的用户反馈信息确定该用户的即时兴趣所对应的物料标签；根据确定出的该用户的即时兴趣所对应的物料标签，选取相应物料标签所对应的物料推送给该用户。通过用户预设时间段内的用户反馈信息进行计算，得到用户即时兴趣物料标签，提高推送物料的准确性和精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种捕捉用户即时兴趣的方法及系统
本专利技术涉及信息推送领域，具体涉及一种捕捉用户即时兴趣的方法及系统。
技术介绍
近年来，内容推荐技术快速发展，极大的提高了人们获取信息的效率。内容推荐的目的就是从冗余的网络信息中获取到用户感兴趣的信息，其中的难点在于，如何准确的捕捉到用户的兴趣。因为用户兴趣并不是保持不变的，会随着所处环境、位置等发生改变，而且这种改变往往会很快，所以这就要求推荐系统具备捕获用户即时兴趣的能力，从而实现更好的推荐效果。在实现本专利技术过程中，申请人发现现有技术中至少存在如下问题：利用用户的全站行为数据进行建模，得到预测用户即时兴趣的模型，用来预测用户下次可能感兴趣的内容。但是具有如下缺点：由于模型的准确性和它本身的复杂程度有一定正相关关系，为了保持精度，模型就需要很复杂，这就带来很大的计算量。所以在实际应用中，为了保证最后结果的准确性，采用模型预测一般会采用离线计算的方式，以牺牲即时性来换取准确性。而用户的即时兴趣是随着时间变化的，这种方法较高的时延注定在预测用户即时兴趣上慢半拍。专...

【技术保护点】
1.一种捕捉用户即时兴趣的方法，其特征在于，包括：/n实时监控网站中各用户对物料的刷新情况，当监控到用户对物料进行刷新时，将用户在刷新物料时所产生的相关信息实时记录到分布式发布订阅消息系统Kafka队列当中，通过Kafka队列将用户在刷新物料时所产生的相关信息存入到数据库Redis中，形成用户反馈信息；其中，每条用户反馈信息包括：用户标识ID、物料所对应的物料标签、对物料标签产生的互动行为、互动行为的产生时间；所述物料是指网站中供用户查看的相关内容，物料标签用于标记物料所属类别；/n当接收到任一用户发起的刷新请求或者需要向该用户推送与其兴趣相匹配的物料时，根据该用户的用户ID从Redis中查询...

【技术特征摘要】
1.一种捕捉用户即时兴趣的方法，其特征在于，包括：
实时监控网站中各用户对物料的刷新情况，当监控到用户对物料进行刷新时，将用户在刷新物料时所产生的相关信息实时记录到分布式发布订阅消息系统Kafka队列当中，通过Kafka队列将用户在刷新物料时所产生的相关信息存入到数据库Redis中，形成用户反馈信息；其中，每条用户反馈信息包括：用户标识ID、物料所对应的物料标签、对物料标签产生的互动行为、互动行为的产生时间；所述物料是指网站中供用户查看的相关内容，物料标签用于标记物料所属类别；
当接收到任一用户发起的刷新请求或者需要向该用户推送与其兴趣相匹配的物料时，根据该用户的用户ID从Redis中查询并获取预设时间段内该用户对应的用户反馈信息，所述预设时间段包括当前时间；根据获取到的用户反馈信息确定该用户的即时兴趣所对应的物料标签；
根据确定出的该用户的即时兴趣所对应的物料标签，选取相应物料标签所对应的物料推送给该用户。

2.根据权利要求1所述的捕捉用户即时兴趣的方法，其特征在于，所述根据获取到的用户反馈信息确定该用户的即时兴趣所对应的物料标签，具体包括：
根据该用户在预设时间段内的用户反馈信息计算得到用户反馈信息中所涉及的每种物料标签的权重系数，根据每种物料标签的权重系数分别得到相应物料标签的权重得分，所述物料标签的权重得分用于表示该种物料标签在用户的所有互动行为所涉及的物料标签中出现的频率；
将每种物料标签的权重得分自大至小排序，将权重得分处于预设排序名次之前的物料标签确定为该用户的即时兴趣所对应的物料标签。

3.根据权利要求2所述的捕捉用户即时兴趣的方法，其特征在于，所述根据该用户在预设时间段内的用户反馈信息计算得到用户反馈信息中所涉及的每种物料标签的权重系数，根据每种物料标签的权重系数分别得到相应物料标签的权重得分，具体包括：
所述物料标签的权重系数通过时间衰减系数表示，所述时间衰减是指预设时间段内该用户刷新请求次数的衰减；
根据每种物料标签的时间衰减系数计算相应物料标签的权重得分，根据物料标签的权重系数计算该种物料标签的权重得分的公式为：

其中，ST表示物料标签T的权重得分；i表示该用户反馈信息中第i种物料标签；n表示互动行为所涉及的物料标签的总个数；表示用户产生互动行为的第i种物料标签是否包含物料标签T，包含时为1，不包含时为0；
γr表示时间衰减系数，γr的计算公式为：λ是第一超参数，用于控制衰减的速度；r表示预设时间段内该用户的刷新请求次数。

4.根据权利要求2所述的捕捉用户即时兴趣的方法，其特征在于，所述根据该用户在预设时间段内的用户反馈信息计算得到用户反馈信息中所涉及的每种物料标签的权重系数，根据每种物料标签的权重系数分别得到相应物料标签的权重得分，具体包括：
所述物料标签的权重系数通过时间衰减系数和互动行为权重系数共同表示；
将每种物料标签的互动行为权重系数与该种物料标签的时间衰减系数之积作为该种物料标签的权重系数，根据物料标签的权重系数计算该种物料标签的权重得分的公式为：

其中，ST表示物料标签T的权重得分；i表示该用户反馈信息中的第i种物料标签；n表示互动行为所涉及的物料标签的总个数；表示用户产生互动行为的第i种物料是否包含物料标签T，包含时为1，不包含为0；
γr表示时间衰减系数，γr的计算公式为：λ是第一超参数，用于控制衰减的速度；r表示预设时间段内该用户的刷新请求次数；wi表示第i种物料标签的互动行为权重系数。

5.根据权利要求2所述的捕捉用户即时兴趣的方法，其特征在于，所述根据该用户在预设时间段内的反馈信息计算得到反馈信息中所涉及的每种物料标签的权重系数，根据每种物料标签的权重系数分别得到相应物料标签的权重得分，具体包括：
通过物料标签的曝光系数、互动行为权重系数、时间衰减系数共同表示该种物料标签的权重系数；
通过物料标签的曝光系数、互动行为权重系数、时间衰减系数之积作为该种物料标签的权重系数，根据物料标签的权重系数计算该种物料标签的权重得分的公式为：

其中，ST表示物料标签T的权重得分；i表示该用户反馈信息中的第i种物料标签；n表示互动行为所涉及的物料标签的总个数；表示用户产生互动行为的第i种物料标签是否包含物料标签T，包含时为1，不包含为0；
γr表示时间衰减系数，γr的计算公式为：λ是第一超参数，用于控制衰减的速度；r表示预设时间段内该用户的刷新请求次数；wi为第i种物料标签的互动行为权重系数；Tweight表示第i种物料标签的曝光系数；所述物料标签的曝光系数通过该种物料标签在预设时间段内的曝光次数与所有物料标签的曝光总次数之间的关系确定，该种物料标签的曝光系数Tweight的计算公式为：式中，pT表示物料标签T在预设时间段内的曝光次数，ptotal表示预设时间段内所有物料标签的曝光总次数，Norm()表示对所有物料标签的曝光总次数与物料标签T在预设时间段内的曝光次数之比进行归一化。

6.根据权利要求4或5所述的捕捉用户即时兴趣的方法，其特征在于，
所述物料标签的互动行为权重系数通过对物料标签的某一互动行为进行分级并对分级后的互动行为进行计算得到；将某一互动行为按照操作步骤进行分级，每个操作步骤对应一个分级，根据互动行为的分级数量计算得到物料标签的该种互动行为权重系数，所述物料标签的该种互动行为权重系数wi的计算公式为：wi＝ka，k是第二超参数，表示每个分级的权重；a为互动行为的操作步骤的步数；
或者，
所述物料标签的互动行为权重系数根据该用户针对该种物料标签的互动行为在全站所有物料标签的互动行为中的占比得到；通过用户反馈信息内对物料标签产生的互动行为统计该用户针对同一种物料标签的互动行为的出现次数，获取全站所有物料标签的互动行为总次数，计算该用户针对同一种物料标签的互动行为的出现次数在全站所有物料标签的互动行为总次数中的占比，将该占比进行归一化处理得出该种物料标签的互动行为权重系数，所述该种物料标签的互动行为权重系数wi的计算公式为：式中，acttotal表示全站所有物料标签的互动行为总次数...

【专利技术属性】
技术研发人员：吴高宇，姜贵彬，
申请(专利权)人：微梦创科网络科技中国有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人