音乐资源个性化推荐方法及系统技术方案

技术编号:5300675 阅读:298 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种音乐资源个性化推荐方法及系统,所述方法包括:从网络上抓取与音乐资源相关的文本信息;统计每个音乐资源的相关文本信息中出现的标签种子及每个标签种子出现的次数,以及所有音乐资源的相关文本信息中出现的标签种子及每个标签种子出现的次数;根据所述所有音乐资源的相关文本信息中出现的标签种子及每个标签种子出现的次数,获得各个标签种子的全局权重;对于单个音乐资源,每个标签种子出现的次数及其全局权重,获得每个标签种子相对于单个音乐资源的单体权重;将单体权重符合预置条件的标签种子确定为音乐资源的标签;根据所述音乐资源的标签进行个性化推荐。通过本发明专利技术,能够实现自动化且相对精准的个性化推荐。

【技术实现步骤摘要】

本专利技术涉及个性化信息推荐
,特别是涉及音乐资源个性化推荐方法及系 统。
技术介绍
随着互联网的发展,音乐资源已经称为互联网应用中非常大的组成部分。各大音 乐网站、音乐软件等为用户提供了数百万计的音乐资源。但是用户却无法在短时间内了解 全部,因此也很难方便地找到自己所喜爱的音乐。这就需要通过某种方法来为用户智能地 推荐其可能感兴趣的音乐,也即个性化的音乐推荐。当前个性化推荐的方法主要是协同过滤推荐算法(CollaborativeFiltering Recommendation)。它通过收集用户的音乐行为习惯,以及用户对音乐的评价,来计算出每 个用户偏爱的音乐列表;进而找出兴趣相似的用户群,对这个用户群关注的音乐进行综合 分析,对该群中的单个用户来说,该群中其他用户偏爱的音乐,就是这个用户可能喜欢的音 乐。如图1所示,竖向的长方形分别代表用户A、B、C、D的听歌列表,协同过滤算法首先找 出有部分相同音乐爱好的用户A、B、C、D,并将用户B、C、D共有的而用户A没有的音乐推荐 给用户A。但是,这种协同过滤推荐算法至少有以下缺点,从来没有被任何用户关注过的音 乐会永远推荐不出来。为此,现有技术还提供了内容过滤推荐算法,这种方法需要为每个 音乐资源加上标签(tag),由于音乐资源的标签代表了音乐资源所述的类别等信息,例如爵 士、摇滚等等,因此,可以根据音乐资源的标签以及用户的喜好来进行个性化推荐。然而,现有技术需要大量的专业人员来对音乐的标签进行提取、标注,工作量非常 大,效率低;并且标注结果在一定程度上受到个人主观因素的影响,可能不准确。
技术实现思路
专利技术提供音乐资源个性化推荐方法及系统,能够实现自动化且相对精准的个性 化推荐。本专利技术提供了如下方案一种音乐资源个性化推荐方法,包括从网络上抓取与音乐资源相关的文本信息;对所述文本信息进行切词,统计每个音乐资源的相关文本信息中出现的标签种子 及每个标签种子出现的次数,以及所有音乐资源的相关文本信息中出现的标签种子及每个 标签种子出现的次数;根据所述所有音乐资源的相关文本信息中出现的标签种子及每个标签种子出现 的次数,获得各个标签种子的全局权重;对于单个音乐资源,根据其相关文本信息中每个标签种子出现的次数及其全局权 重,获得每个标签种子相对于单个音乐资源的单体权重;将单体权重符合预置条件的标签种子确定为音乐资源的标签;根据所述音乐资源的标签进行个性化推荐。优选的,所述根据所述音乐资源的标签进行个性化推荐包括对于一音乐资源集合,合并该集合中各音乐资源的标签;根据各标签相对于各音乐资源中的单体权重,得到合并后的各标签的权重;将权重符合预置条件的标签确定为该音乐资源集合的标签;根据所述音乐资源集合的标签进行个性化推荐。优选的,所述音乐资源集合包括各个歌手的音乐资源,所述音乐资源集合的标签 包括各个歌手的标签,所述根据所述音乐资源的标签进行个性化推荐包括将每个歌手的标签的权重映射到向量空间,得到每个歌手的标签向量;两两计算标签向量之间的余弦夹角,得到各歌手两两之间的相似度;根据歌手之间的相似度进行个性化推荐。优选的,所述音乐资源集合包括各个用户听过的所有音乐资源,所述音乐资源集 合的标签包括各个用户的标签,所述根据所述音乐资源的标签进行个性化推荐包括基于每个音乐资源的标签建立倒排表,得到每个标签对应的音乐资源列表;根据用户的标签以及标签对应的音乐资源列表进行个性化推荐。优选的,还包括根据各用户的收听行为历史记录,调整各标签相对各用户的权重。优选的,还包括对用户的标签按照权重从大到小的顺序排序,并将排在前面的预置数目的标签, 确定为该用户的大众标签;所述根据用户的标签以及标签对应的音乐资源列表进行个性化推荐包括根据所 述用户的大众标签以及标签对应的音乐资源列表进行个性化推荐。优选的,还包括根据每个用户的标签的权重,计算每个标签在所有用户中的平均权重;将该用户的标签按照相对该用户的权重与所述平均权重的商的大小来排序,并将 排在前面的预置数目的标签,确定为该用户的长尾标签;所述根据用户的标签以及标签对应的音乐资源列表进行个性化推荐包括根据所 述用户的长尾标签以及标签对应的音乐资源列表进行个性化推荐。一种音乐资源个性化推荐系统,包括信息抓取单元,用于从网络上抓取与音乐资源相关的文本信息;统计单元,用于对所述文本信息进行切词,统计每个音乐资源的相关文本信息中 出现的标签种子及每个标签种子出现的次数,以及所有音乐资源的相关文本信息中出现的 标签种子及每个标签种子出现的次数;全局权重获取单元,用于根据所述所有音乐资源的相关文本信息中出现的标签种 子及每个标签种子出现的次数,获得各个标签种子的全局权重;单体权重获取单元,用于对于单个音乐资源,根据其相关文本信息中每个标签种 子出现的次数及其全局权重,获得每个标签种子相对于单个音乐资源的单体权重;音乐标签确定单元,用于将单体权重符合预置条件的标签种子确定为音乐资源的标签;推荐单元,用于根据所述音乐资源的标签进行个性化推荐。优选的,所述推荐单元包括标签合并子单元,用于对于一音乐资源集合,合并该集合中各音乐资源的标签;权重合并子单元,用于根据各标签相对于各音乐资源中的单体权重,得到合并后 的各标签的权重;集合标签确定子单元,用于将权重符合预置条件的标签确定为该音乐资源集合的 标签;第一推荐子单元,用于根据所述音乐资源集合的标签进行个性化推荐。优选的,所述音乐资源集合包括各个歌手的音乐资源,所述音乐资源集合的标签 包括各个歌手的标签,所述第一推荐子单元包括标签向量获取子单元,用于将每个歌手的标签的权重映射到向量空间,得到每个 歌手的标签向量;相似度计算子单元,用于两两计算标签向量之间的余弦夹角,得到各歌手两两之 间的相似度; 歌手推荐子单元,用于根据歌手之间的相似度进行个性化推荐。优选的,所述音乐资源集合包括各个用户听过的所有音乐资源,所述音乐资源集 合的标签包括各个用户的标签,所述第一推荐子单元包括倒排子单元,用于基于每个音乐资源的标签建立倒排表,得到每个标签对应的音 乐资源列表;标签推荐子单元,用于根据用户的标签以及标签对应的音乐资源列表进行个性化 推荐。优选的,还包括权重调整单元,用于根据各用户的收听行为历史记录,调整各标签相对各用户的权重。优选的,还包括大众标签获取单元,用于对用户的标签按照权重从大到小的顺序排序,并将排在 前面的预置数目的标签,确定为该用户的大众标签;所述标签推荐子单元具体用于根据所述用户的大众标签以及标签对应的音乐资 源列表进行个性化推荐。优选的,还包括平均权重计算单元,用于根据每个用户的标签的权重,计算每个标签在所有用户 中的平均权重;长尾标签获取单元,用于将该用户的标签按照相对该用户的权重与所述平均权重 的商的大小来排序,并将排在前面的预置数目的标签,确定为该用户的长尾标签;所述标签推荐子单元具体用于根据所述用户的长尾标签以及标签对应的音乐资 源列表进行个性化推荐。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果本专利技术通过自动从网络上抓取音乐资源的相关文本信息,然后自动从相关文本信息中提取音乐资源的标签,以便根据音乐资源的标签向用户进行个性化的音乐资源推荐, 因此,能够实现自动化且相对精准的本文档来自技高网...

【技术保护点】
一种音乐资源个性化推荐方法,其特征在于,包括:从网络上抓取与音乐资源相关的文本信息;对所述文本信息进行切词,统计每个音乐资源的相关文本信息中出现的标签种子及每个标签种子出现的次数,以及所有音乐资源的相关文本信息中出现的标签种子及每个标签种子出现的次数;根据所述所有音乐资源的相关文本信息中出现的标签种子及每个标签种子出现的次数,获得各个标签种子的全局权重;对于单个音乐资源,根据其相关文本信息中每个标签种子出现的次数及其全局权重,获得每个标签种子相对于单个音乐资源的单体权重;将单体权重符合预置条件的标签种子确定为音乐资源的标签;根据所述音乐资源的标签进行个性化推荐。

【技术特征摘要】

【专利技术属性】
技术研发人员:辜炜东陈亮
申请(专利权)人:亿览在线网络技术北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1