System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大数据的音乐推送方法及系统技术方案_技高网

一种基于大数据的音乐推送方法及系统技术方案

技术编号:40521414 阅读:7 留言:0更新日期:2024-03-01 13:39
本发明专利技术公开了一种基于大数据的音乐推送方法及系统,具体涉及音乐推送技术领域,基于训练好的用户偏好预测模型得到用户对于新音乐的偏好程度,得到用户感兴趣音乐集合A;基于协同过滤推荐算法得到用户相似人群,将用户Yv喜欢的音乐推荐给用户Yu,得到用户感兴趣音乐集合B;将用户感兴趣音乐集合A、集合B按照等数量音乐进行划分,得到若干区域,基于每个区域的偏好程度指数平均值,设置每个区域的选取概率;基于设置的选取概率从每个区域中随机得到音乐,构成用户Yu的音乐推送列表,能够克服传统单一音乐推荐算法的局限性,增加个性化的随机推送,从而为用户提供更为精准、个性化的音乐推荐服务。

【技术实现步骤摘要】

本专利技术涉及音乐推送,更具体地说,本专利技术涉及一种基于大数据的音乐推送方法及系统


技术介绍

1、随着互联网技术及音乐资源电子化地持续发展,用户获取音乐资源的途径和方式变得越来越简单和便捷。只需轻点鼠标,海量的音乐资源就会呈现在眼前。然而,随着音乐库的规模不断扩大,用户在寻找自己喜爱的音乐时却遇到了新的难题。如何在浩如烟海的音乐库中快速找到触动自己心灵的音乐,成为摆在用户面前的一大挑战。

2、现有的音乐推荐算法多为单一推荐算法,常见的推荐算法包括基于用户历史记录的内容推荐算法和协同过滤推荐算法,在基于内容的推荐算法中,音乐的特征被作为主要的推荐依据。这些特征可能包括音乐的风格、节奏、旋律、歌词等,通过分析用户历史听歌记录和歌曲特征,基于内容的推荐算法可以为用户推荐类似风格的音乐,然而,这种推荐方式往往只考虑了音乐的共性特征,而忽略了用户个体的差异和多样性需求;协同过滤推荐算法则是一种基于用户行为的推荐方法,通过分析用户之间的行为相似度,将具有相似听歌习惯的用户喜欢的音乐推荐给新用户,这种推荐方式能够考虑到用户的个性化需求和市场动态变化。但随着音乐库的不断扩大,用户之间的行为相似度可能会变得越来越低,导致协同过滤的效果下降。

3、综上,现有的音乐推送系统存在的问题有:通过分析用户历史听歌记录和歌曲特征,基于内容的推荐算法可以为用户推荐类似风格的音乐,只考虑了音乐的共性特征,而忽略了用户个体的差异和多样性需求,导致用户对音乐推送平台的粘性降低,导致用户流失。


技术实现思路>

1、为了克服现有技术的上述缺陷,本专利技术提供一种基于大数据的音乐推送方法及系统,基于训练好的用户偏好预测模型得到用户对于新音乐的偏好程度,得到用户感兴趣音乐集合a;基于协同过滤推荐算法得到用户相似人群,将用户yv喜欢的音乐推荐给用户yu,得到用户感兴趣音乐集合b;将用户感兴趣音乐集合a、集合b按照等数量音乐进行划分,得到若干区域,基于每个区域的偏好程度指数平均值,设置每个区域的选取概率;基于设置的选取概率从每个区域中随机得到音乐,构成用户yu的音乐推送列表,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种基于大数据的音乐推送方法,包括下列步骤:

3、采集用户信息,包括用户基础信息、音乐基础信息和用户行为数据;

4、将用户行为数据输入偏好程度分析模型,得到用户对音乐偏好指数pi;

5、基于聚类分析得到音乐向量矩阵pw,将用户对音乐偏好指数pi记为目标变量,通过机器学习得到每个维度特征向量的贡献度集合gx;

6、基于训练好的用户偏好预测模型得到用户对于新音乐的偏好程度,将满足预设值tha的新音乐标记为用户感兴趣音乐集合a,将用户记为yu;

7、从用户yu信息中筛选得到冷门音乐,通过协同过滤推荐算法,分析用户之间的行为相似度,基于行为相似度得到用户相似人群,将用户相似人群记为yv,将用户yv喜欢的音乐推荐给用户yu,得到用户感兴趣音乐集合b;

8、将用户感兴趣音乐集合a和用户感兴趣音乐集合b按照等数量音乐进行划分,得到若干区域,基于每个区域的偏好程度指数平均值,设置每个区域的选取概率xpi;

9、基于设置的选取概率从每个区域中随机得到音乐,构成用户yu的音乐推送列表。

10、优选的,所述音乐基础信息包括音乐名称、作曲者信息、歌唱者信息、歌词文本内容、音乐时长,所述用户行为数据包括用户播放音乐的次数、时间、评论、分享信息。

11、优选的,基于用户行为信息得到用户对音乐的偏好程度指数,将用户第i首音乐对应的偏好程度指数记为pi,i表示音乐编号,i的取值为[1-n],将获取的用户行为数据输入偏好程度分析模型得到用户对于音乐的偏好程度指数,其中bc表示用户播放第i首音乐的次数、b总表示用户的月均播放音乐的总次数、sc第i首音乐的播放时长,单位是分钟,bp表示用户播放第i首音乐的频率,bp取月均频率,fx表示用户分享、评论第i首音乐的次数,fy表示用户月均分享次数与评论次数的总和,其中,α、β是权重系数:,,且,具体基于管理人员设置。

12、优选的,基于用户对音乐偏好指数得到用户感兴趣的音乐集合gu,音乐集合gu中包括n首音乐,基于聚类分析技术提取得到若干个音乐特征维度,得到关于每首音乐的音乐特征向量,将提取的音乐特征向量转映射成取值范围在[0-1]的数值,基于音乐集合gu得到音乐向量矩阵pw,设音乐特征维度有m个,则音乐向量矩阵pw满足,其中wij表示用户对于第i首音乐中第j个特征维度的向量值,j表示特征维度的编号,取值为[1-m]。

13、优选的,通过聚类分析得到用户对于音乐的若干特征维度的向量值,包括下列步骤:

14、特征提取:基于音乐集合gu提取音乐特征,音乐特征至少包括音乐的文本特征和旋律特征,基于音乐对应的歌词、文本内容,经过特征提取得到若干维度的音乐文本特征,至少包括歌词的词频、情感分析得分、主题词;基于音乐对应的音频信号,得到若干维度的音乐旋律特征,至少包括节奏、音高、和弦;

15、聚类分析:使用k-means、层次聚类或其他聚类算法对提取的特征进行聚类,通过轮廓系数、肘部法则来确定聚类数量,即得到特征向量的维度;

16、对于每个聚类,计算每个聚类的中心点,即计算每个特征维度的平均值,特征维度的平均值理解为该聚类代表的向量值;

17、向量值:计算每个音乐特征与每个聚类的中心点的距离,经过线性归一得到每个特征维度平均值的距离,得到音乐的特征维度的向量值。

18、优选的,贡献度集合的获取方式为:使用机器学习算法将音乐向量矩阵pw映射到偏好程度指数为pi,得到每个音乐特征维度的贡献度参数,若干个音乐特征维度构成贡献度集合,得到每个用户关于音乐特征维度对应的贡献度集合gx,满足,将第j个特征维度对应的贡献度记为gj,即满足,将获取的贡献度集合存储在数据库中等待调用。

19、优选的,贡献度集合的获取方式为:获取新音乐在m个文本特征维度的向量值xwj,从数据库中获取音乐文本特征维度对应的贡献度集合gj,预测得到用户对于新音乐文本的偏好程度指数,满足公式,其中,ypi表示基于第i首新音乐的音乐文本特征向量和贡献度加权求和得到的音乐偏好指数。

20、优选的,从用户yu的信息中筛选出冷门音乐,然后通过分析与其他用户的行为相似度来找出与用户yu最相似的其他用户,最后基于这些相似度信息为用户推荐音乐,包括下列步骤:

21、从用户yu信息中筛选得到冷门音乐:收集用户yu听过的所有音乐信息,

22、通过协同过滤推荐算法,通过分析用户之间的听冷门歌行为相似度,计算用户yu与其他用户之间的行为相似度lxs;

23、基于行为相似度lxs得到用户的相似人群,相似人群喜欢的冷门音乐构成用户感兴趣音乐集合b。

24、优选的,所述行为相似度lxs的获取方式为:<本文档来自技高网...

【技术保护点】

1.一种基于大数据的音乐推送方法,其特征在于,包括下列步骤:

2.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,所述音乐基础信息包括音乐名称、作曲者信息、歌唱者信息、歌词文本内容、音乐时长,所述用户行为数据包括用户播放音乐的次数、时间、评论、分享信息。

3.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,基于用户行为信息得到用户对音乐的偏好程度指数,将用户第i首音乐对应的偏好程度指数记为pi,i表示音乐编号,i的取值为[1-n],将获取的用户行为数据输入偏好程度分析模型得到用户对于音乐的偏好程度指数,其中bc表示用户播放第i首音乐的次数、b总表示用户的月均播放音乐的总次数、sc第i首音乐的播放时长,单位是分钟,bp表示用户播放第i首音乐的频率,bp取月均频率,fx表示用户分享、评论第i首音乐的次数,fy表示用户月均分享次数与评论次数的总和,其中,α、β是权重系数:,,且,具体基于管理人员设置。

4.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,基于用户对音乐偏好指数得到用户感兴趣的音乐集合Gu,音乐集合Gu中包括n首音乐,基于聚类分析技术提取得到若干个音乐特征维度,得到关于每首音乐的音乐特征向量,将提取的音乐特征向量转映射成取值范围在[0-1]的数值,基于音乐集合Gu得到音乐向量矩阵Pw,设音乐特征维度有m个,则音乐向量矩阵Pw满足,其中wij表示用户对于第i首音乐中第j个特征维度的向量值,j表示特征维度的编号,取值为[1-m]。

5.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,贡献度集合的获取方式为:使用机器学习算法将音乐向量矩阵Pw映射到偏好程度指数为pi,得到每个音乐特征维度的贡献度参数,若干个音乐特征维度构成贡献度集合,得到每个用户关于音乐特征维度对应的贡献度集合Gx,满足,将第j个特征维度对应的贡献度记为gj,即满足,将获取的贡献度集合存储在数据库中等待调用。

6.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,贡献度集合的获取方式为:获取新音乐在m个文本特征维度的向量值xwj,从数据库中获取音乐文本特征维度对应的贡献度集合gj,预测得到用户对于新音乐文本的偏好程度指数,满足公式,其中,YPi表示基于第i首新音乐的音乐文本特征向量和贡献度加权求和得到的音乐偏好指数。

7.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,从用户Yu的信息中筛选出冷门音乐,然后通过分析与其他用户的行为相似度来找出与用户Yu最相似的其他用户,最后基于这些相似度信息为用户推荐音乐,包括下列步骤:

8.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,所述行为相似度Lxs的获取方式为:

9.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,

10.一种基于大数据的音乐推送系统,应用有权利要求1-9任一所述的方法,其特征在于,包括:

...

【技术特征摘要】

1.一种基于大数据的音乐推送方法,其特征在于,包括下列步骤:

2.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,所述音乐基础信息包括音乐名称、作曲者信息、歌唱者信息、歌词文本内容、音乐时长,所述用户行为数据包括用户播放音乐的次数、时间、评论、分享信息。

3.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,基于用户行为信息得到用户对音乐的偏好程度指数,将用户第i首音乐对应的偏好程度指数记为pi,i表示音乐编号,i的取值为[1-n],将获取的用户行为数据输入偏好程度分析模型得到用户对于音乐的偏好程度指数,其中bc表示用户播放第i首音乐的次数、b总表示用户的月均播放音乐的总次数、sc第i首音乐的播放时长,单位是分钟,bp表示用户播放第i首音乐的频率,bp取月均频率,fx表示用户分享、评论第i首音乐的次数,fy表示用户月均分享次数与评论次数的总和,其中,α、β是权重系数:,,且,具体基于管理人员设置。

4.根据权利要求1所述的一种基于大数据的音乐推送方法,其特征在于,基于用户对音乐偏好指数得到用户感兴趣的音乐集合gu,音乐集合gu中包括n首音乐,基于聚类分析技术提取得到若干个音乐特征维度,得到关于每首音乐的音乐特征向量,将提取的音乐特征向量转映射成取值范围在[0-1]的数值,基于音乐集合gu得到音乐向量矩阵pw,设音乐特征维度有m个,则音乐向量矩阵pw满足,其中wij表示用户对于第i首音乐中第j个特征维度的向量值...

【专利技术属性】
技术研发人员:李绍伟
申请(专利权)人:山东石油化工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1