一种基于用户行为序列和数据融合的推荐系统召回方法及系统技术方案

技术编号：23315238 阅读：33 留言：0更新日期：2020-02-11 17:50

本发明专利技术公开了一种基于用户行为序列和数据融合的推荐系统召回方法及系统，所述方法包括获取网络音乐平台上用户的不同行为类型的音频专辑序列数据；对音频专辑序列数据进行数据预处理；分别将进行数据预处理后得到的不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型；通过不同行为类型的Word2Vec行为模型分别对用户行为序列对应的被触发的音频专辑进行召回，得到对应的召回集；对不同行为类型的Word2Vec行为模型对应的召回集进行数据融合，得到推荐系统召回数据集。本发明专利技术考虑到了用户的各种行为序列，同时结合多Word2Vec模型的融合策略，有效提升了召回的准确性和召回的覆盖度。

A recall method and system of recommendation system based on user behavior sequence and data fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户行为序列和数据融合的推荐系统召回方法及系统
本专利技术涉及数据处理
，尤其涉及一种基于用户行为序列和数据融合的推荐系统召回方法及系统。
技术介绍
目前业界流行的推荐算法架构分成经典的三个部分，包括粗排召回，精排，和业务逻辑排序。其中每一部分都具有很多不同的算法模型实现，但已有的各种粗排召回算法在音频领域效果一般，无论是召回的覆盖度还是音频节目之间的精准度，都有待进一步优化提高，且没有考虑到用户不同的行为对召回结果带来的影响。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一，特别创新地提出了一种基于用户行为序列和数据融合的推荐系统召回方法及系统，能够有效提升召回的准确性和召回的覆盖度。为了实现本专利技术的上述目的，根据本专利技术的第一个方面，本专利技术提供了一种基于用户行为序列和数据融合的推荐系统召回方法，所述方法包括如下步骤：获取网络音乐平台上用户的不同行为类型的音频专辑序列数据；对所述音频专辑序列数据进行数据预处理；分别将进行数据预处理后得到的所述不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型；通过不同行为类型的所述Word2Vec行为模型分别对所述用户行为序列对应的被触发的音频专辑进行召回，得到对应的召回集；对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合，得到推荐系统召回数据集。优选地，所述行为类型包括点击、播放...

【技术保护点】
1.一种基于用户行为序列和数据融合的推荐系统召回方法，其特征在于，所述方法包括：/n获取网络音乐平台上用户的不同行为类型的音频专辑序列数据；/n对所述音频专辑序列数据进行数据预处理；/n分别将进行数据预处理后得到的所述不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型；/n通过不同行为类型的所述Word2Vec行为模型分别对所述用户行为序列对应的被触发的音频专辑进行召回，得到对应的召回集；/n对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合，得到推荐系统召回数据集。/n

【技术特征摘要】
1.一种基于用户行为序列和数据融合的推荐系统召回方法，其特征在于，所述方法包括：
获取网络音乐平台上用户的不同行为类型的音频专辑序列数据；
对所述音频专辑序列数据进行数据预处理；
分别将进行数据预处理后得到的所述不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型；
通过不同行为类型的所述Word2Vec行为模型分别对所述用户行为序列对应的被触发的音频专辑进行召回，得到对应的召回集；
对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合，得到推荐系统召回数据集。

2.根据权利要求1所述的基于用户行为序列和数据融合的推荐系统召回方法，其特征在于，所述行为类型包括点击、播放、搜索、收藏和下载，对应地，所述Word2Vec行为模型包括Word2Vec点击模型、Word2Vec播放模型、Word2Vec搜索模型、Word2Vec收藏模型和Word2Vec下载模型。

3.根据权利要1所述的基于用户行为序列和数据融合的推荐系统召回方法，其特征在于，所述获取网络音乐平台上用户的不同行为类型的音频专辑序列数据包括：
获取网络音乐平台上的用户行为序列；
基于所述用户行为序列按照用户对音频专辑的用户行为的时间顺序进行排序得到不同行为类型的音频专辑序列数据。

4.根据权利要求1所述的基于用户行为序列和数据融合的推荐系统召回方法，其特征在于，所述对所述音频专辑序列数据进行数据预处理包括：
对所述音频专辑序列数据进行数据清洗。

5.根据权利要求1-4任意一项所述的基于用户行为序列和数据融合的推荐系统召回方法，其特征在于，所述对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合，得到推荐系统召回数据集包括：
对不同行为类型的所述Word2Vec行为模型对应的召回集中音频专辑名相同但得分不同的数据，按照取最大得分的原则保留该音频专辑最大得分的那条数据，同时保留不同行为类型的所述Word2Vec行为模型对应的召回集中音频专辑名不同的相关数据，将所述保留得到的数据进行整理合并得到所述推荐系统召...

【专利技术属性】
技术研发人员：徐文铭，杨晶生，
申请(专利权)人：上海麦克风文化传媒有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人