一种基于用户行为序列和数据融合的推荐系统召回方法及系统技术方案

技术编号:23315238 阅读:33 留言:0更新日期:2020-02-11 17:50
本发明专利技术公开了一种基于用户行为序列和数据融合的推荐系统召回方法及系统,所述方法包括获取网络音乐平台上用户的不同行为类型的音频专辑序列数据;对音频专辑序列数据进行数据预处理;分别将进行数据预处理后得到的不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型;通过不同行为类型的Word2Vec行为模型分别对用户行为序列对应的被触发的音频专辑进行召回,得到对应的召回集;对不同行为类型的Word2Vec行为模型对应的召回集进行数据融合,得到推荐系统召回数据集。本发明专利技术考虑到了用户的各种行为序列,同时结合多Word2Vec模型的融合策略,有效提升了召回的准确性和召回的覆盖度。

A recall method and system of recommendation system based on user behavior sequence and data fusion

【技术实现步骤摘要】
一种基于用户行为序列和数据融合的推荐系统召回方法及系统
本专利技术涉及数据处理
,尤其涉及一种基于用户行为序列和数据融合的推荐系统召回方法及系统。
技术介绍
目前业界流行的推荐算法架构分成经典的三个部分,包括粗排召回,精排,和业务逻辑排序。其中每一部分都具有很多不同的算法模型实现,但已有的各种粗排召回算法在音频领域效果一般,无论是召回的覆盖度还是音频节目之间的精准度,都有待进一步优化提高,且没有考虑到用户不同的行为对召回结果带来的影响。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一,特别创新地提出了一种基于用户行为序列和数据融合的推荐系统召回方法及系统,能够有效提升召回的准确性和召回的覆盖度。为了实现本专利技术的上述目的,根据本专利技术的第一个方面,本专利技术提供了一种基于用户行为序列和数据融合的推荐系统召回方法,所述方法包括如下步骤:获取网络音乐平台上用户的不同行为类型的音频专辑序列数据;对所述音频专辑序列数据进行数据预处理;分别将进行数据预处理后得到的所述不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型;通过不同行为类型的所述Word2Vec行为模型分别对所述用户行为序列对应的被触发的音频专辑进行召回,得到对应的召回集;对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合,得到推荐系统召回数据集。优选地,所述行为类型包括点击、播放、搜索、收藏和下载,对应地,所述Word2Vec行为模型包括Word2Vec点击模型、Word2Vec播放模型、Word2Vec搜索模型、Word2Vec收藏模型和Word2Vec下载模型。优选地,所述获取网络音乐平台上用户的不同行为类型的音频专辑序列数据包括:获取网络音乐平台上的用户行为序列;基于所述用户行为序列按照用户对音频专辑的用户行为的时间顺序进行排序得到不同行为类型的音频专辑序列数据。优选地,所述对所述音频专辑序列数据进行数据预处理包括:对所述音频专辑序列数据进行数据清洗。优选地,所述对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合,得到推荐系统召回数据集包括:对不同行为类型的所述Word2Vec行为模型对应的召回集中音频专辑名相同但得分不同的数据,按照取最大得分的原则保留该音频专辑最大得分的那条数据,同时保留不同行为类型的所述Word2Vec行为模型对应的召回集中音频专辑名不同的相关数据,将所述保留得到的数据进行整理合并得到所述推荐系统召回数据集。根据本专利技术的第二个方面,本专利技术提供了一种基于用户行为序列和数据融合的推荐系统召回系统,所述系统包括:数据获取模块,用于获取网络音乐平台上用户的不同行为类型的音频专辑序列数据;数据预处理模块,用于对所述音频专辑序列数据进行数据预处理;模型训练模块,用于分别将进行数据预处理后得到的所述不同行为类型的音频专辑序列数据对Word7Vec模型进行训练得到对应的不同行为类型的Word7Vec行为模型;数据召回模块,用于通过不同行为类型的所述Word7Vec行为模型分别对所述用户行为序列对应的被触发的音频专辑进行召回,得到对应的召回集;数据融合模块,对不同行为类型的所述Word7Vec行为模型对应的召回集进行数据融合,得到推荐系统召回数据集。优选地,所述行为类型包括点击、播放、搜索、收藏和下载,对应地,所述Word7Vec行为模型包括Word7Vec点击模型、Word7Vec播放模型、Word7Vec搜索模型、Word7Vec收藏模型和Word7Vec下载模型。优选地,所述数据获取模块具体用于:获取网络音乐平台上的用户行为序列;基于所述用户行为序列按照用户对音频专辑的用户行为的时间顺序进行排序得到不同行为类型的音频专辑序列数据。优选地,所述数据预处理模块具体用于:对所述音频专辑序列数据进行数据清洗。优选地,所述数据融合模块具体用于:对不同行为类型的所述Word7Vec行为模型对应的召回集中音频专辑名相同但得分不同的数据,按照取最大得分的原则保留该音频专辑最大得分的那条数据,同时保留不同行为类型的所述Word7Vec行为模型对应的召回集中音频专辑名不同的相关数据,将所述保留得到的数据进行整理合并得到所述推荐系统召回数据集。由以上方案可知,本专利技术提供了一种基于用户行为序列和数据融合的推荐系统召回方法及系统,所述方法包括获取网络音乐平台上用户的不同行为类型的音频专辑序列数据;对所述音频专辑序列数据进行数据预处理;分别将进行数据预处理后得到的所述不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型;通过不同行为类型的所述Word2Vec行为模型分别对所述用户行为序列对应的被触发的音频专辑进行召回,得到对应的召回集;对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合,得到推荐系统召回数据集。本专利技术考虑到了用户的各种行为序列,将用户的多种行为序列转成用户对音频专辑序列数据,然后将音频专辑序列数据作为Word2Vec模型的训练语料训练模型,得到的每个模型在单个召回时优势各不相同,再通过多Word2Vec模型的融合策略,有效提升了召回的准确性和召回的覆盖度。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术提供的一种优选实施方式中基于用户行为序列和数据融合的推荐系统召回方法的流程示意图;图2是本专利技术提供的一种优选实施方式中基于用户行为序列和数据融合的推荐系统召回系统的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本专利技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。在本专利技术的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具本文档来自技高网
...

【技术保护点】
1.一种基于用户行为序列和数据融合的推荐系统召回方法,其特征在于,所述方法包括:/n获取网络音乐平台上用户的不同行为类型的音频专辑序列数据;/n对所述音频专辑序列数据进行数据预处理;/n分别将进行数据预处理后得到的所述不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型;/n通过不同行为类型的所述Word2Vec行为模型分别对所述用户行为序列对应的被触发的音频专辑进行召回,得到对应的召回集;/n对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合,得到推荐系统召回数据集。/n

【技术特征摘要】
1.一种基于用户行为序列和数据融合的推荐系统召回方法,其特征在于,所述方法包括:
获取网络音乐平台上用户的不同行为类型的音频专辑序列数据;
对所述音频专辑序列数据进行数据预处理;
分别将进行数据预处理后得到的所述不同行为类型的音频专辑序列数据对Word2Vec模型进行训练得到对应的不同行为类型的Word2Vec行为模型;
通过不同行为类型的所述Word2Vec行为模型分别对所述用户行为序列对应的被触发的音频专辑进行召回,得到对应的召回集;
对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合,得到推荐系统召回数据集。


2.根据权利要求1所述的基于用户行为序列和数据融合的推荐系统召回方法,其特征在于,所述行为类型包括点击、播放、搜索、收藏和下载,对应地,所述Word2Vec行为模型包括Word2Vec点击模型、Word2Vec播放模型、Word2Vec搜索模型、Word2Vec收藏模型和Word2Vec下载模型。


3.根据权利要1所述的基于用户行为序列和数据融合的推荐系统召回方法,其特征在于,所述获取网络音乐平台上用户的不同行为类型的音频专辑序列数据包括:
获取网络音乐平台上的用户行为序列;
基于所述用户行为序列按照用户对音频专辑的用户行为的时间顺序进行排序得到不同行为类型的音频专辑序列数据。


4.根据权利要求1所述的基于用户行为序列和数据融合的推荐系统召回方法,其特征在于,所述对所述音频专辑序列数据进行数据预处理包括:
对所述音频专辑序列数据进行数据清洗。


5.根据权利要求1-4任意一项所述的基于用户行为序列和数据融合的推荐系统召回方法,其特征在于,所述对不同行为类型的所述Word2Vec行为模型对应的召回集进行数据融合,得到推荐系统召回数据集包括:
对不同行为类型的所述Word2Vec行为模型对应的召回集中音频专辑名相同但得分不同的数据,按照取最大得分的原则保留该音频专辑最大得分的那条数据,同时保留不同行为类型的所述Word2Vec行为模型对应的召回集中音频专辑名不同的相关数据,将所述保留得到的数据进行整理合并得到所述推荐系统召...

【专利技术属性】
技术研发人员:徐文铭杨晶生
申请(专利权)人:上海麦克风文化传媒有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1