一种基于用户行为的音频个性化推荐方法和系统技术方案

技术编号:14399528 阅读:135 留言:0更新日期:2017-01-11 12:45
本发明专利技术公开了一种基于用户行为的音频个性化推荐方法和系统,能把被海量音频淹没的优质内容呈现给听众,为听众提供更好的个性化推荐服务。其技术方案为:收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;对所收集的用户行为数据进行清洗和整合;基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。

【技术实现步骤摘要】

本专利技术涉及互联网尤其是移动互联网音频媒体领域,涉及数据收集、存储、处理和算法使用等技术。特别是涉及一种对用户行为进行多维度分析,进而可以探索用户与其他用户的协同交互,用户和音频内容的特征提取,综合各种行为特征,计算用户对音频内容的评分,从而可以向用户进行个性化推荐的一种方法和系统。
技术介绍
近些年来,随着互联网技术和移动通讯的迅猛发展,移动互联网为人们的生活提供了前所未有的高效和便利。人们可以用过具有上网功能移动设备迅速获取所需生活,娱乐,学习等方方面面的信息。由于现代人工作繁忙,生活节奏快,“没有时间”去读报纸,看新闻,欣赏音乐等的现象已经变得越来越常见。而移动音频为人们提供一种最佳的利用如上下班路途,排队等候,运动健身等零碎时间的媒介。但是,随着数据技术的发展和用户需求的提高,音频的累积数据日益剧增,面对海量音频内容,要找到用户真正感兴趣的内容成为提高用户体验的关键。业界亟待开发一种系统,能够为准确高效地从不同的角度为用户推荐用户所需要的音频内容。
技术实现思路
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。本专利技术的目的在于解决上述问题,提供了一种基于用户行为的音频个性化推荐方法和系统,能把被海量音频淹没的优质内容呈现给听众,为听众提供更好的个性化推荐服务。本专利技术的技术方案为:本专利技术揭示了一种基于用户行为的音频个性化推荐方法,包括:步骤1:收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;步骤2:对所收集的用户行为数据进行清洗和整合;步骤3:基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;步骤4:基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。根据本专利技术的基于用户行为的音频个性化推荐方法的一实施例,步骤1中,用户的人口学特征包括用户的性别、年龄和地域,用户行为数据包括用户的登录行为数据、用户收听音频内容的时长和播放比例、用户订阅的音频内容、用户评论的音频内容,音频内容的特征属性包括音频内容的类别、简介、标签、发布规律和初始评分。根据本专利技术的基于用户行为的音频个性化推荐方法的一实施例,步骤2进一步包括:对用户登录时间低于预设值且收听比例小于预设值的收听行为标记为误点击,从用户收听记录中删除;用户对特定音频内容的收听间隔进行划分,小于指定间隔的将两次收听整合在一起,用于描述用户特定时段的收听新区,对用户特定时段收听的类别和标签进行统计,取出出现频率最高的标记为用户时段偏好;进行时段划分,统计用户收听时段和时段偏好并做相应的标记;考察音频内容被收听的时段,统计其出现频率在前的时段并做相应的标记,补充为音频内容的标签;将用户当天对音频内容的收听行为按照收听时间和完播比例进行汇总,按照天数进行衰减,整合后的数据平衡考虑用户长短期的兴趣;剔除用户远期订阅行为数据。根据本专利技术的基于用户行为的音频个性化推荐方法的一实施例,步骤3进一步包括:指定用户间互动较多的多个用户最近收听的音频内容作为给定用户基于社交关系的推荐候选音频内容;对用户收听历史进行分析,根据收听时间的长短,进行预评分;将用户收听历史相关性最大的多个音频内容选取为基于收听行为的候选音频内容集合;根据用户收听历史音频内容评分,结合音频内容之间的相关性,计算对优选音频内容的评分。根据本专利技术的基于用户行为的音频个性化推荐方法的一实施例,步骤4进一步包括:基于每一音频内容的评分,将评分达到预定阈值的音频内容进行排序,并过滤掉用户最近收听和订阅的音频内容后,取得排名高于预设值的音频内容后,推送给用户。本专利技术还揭示了一种基于用户行为的音频个性化推荐系统,包括:数据收集模块,收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;数据处理模块,对所收集的用户行为数据进行清洗和整合;特征分析模块,基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;混合推荐模块,基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。根据本专利技术的基于用户行为的音频个性化推荐系统的一实施例,数据收集模块包括:用户注册数据收集单元,收集用户注册时的用户性别、兴趣偏好、年龄、用户标签;用户收听行为收集单元,收集用户的收听时长、收听类别、收听时段、登录时间;用户社交行为收集单元,收集用户的社交行为,包括订阅、关注、私信、点赞、评论;音频特征收集单元,收集音频和主播的特征、简介和标签。根据本专利技术的基于用户行为的音频个性化推荐系统的一实施例,数据处理模块包括:数据清洗单元,统计用户在线以剔除异常用户,剔除用户单次收听时间小于预设值的收听记录,剔除用户远期的订阅和关注记录;数据整合单元,将一天内单个用户对单个内容的多次收听进行整合,同时将用户的订阅、点赞、评论行为分别进行整合,然后对用户中长期的行为关于时间进行衰减。根据本专利技术的基于用户行为的音频个性化推荐系统的一实施例,特征分析模块包括:特征提取单元,进行用户特征分析和音频内容特征分析,用户特征分析包括分析用户的性别、年龄、时段偏好、类别偏好,建立用户特征,音频内容特征分析包括对音频内容的简介、标签进行分析,并基于标签建立音频内容之间的相关性;相关性分析单元,计算用户之间的关系以及音频内容之间的关系;评分计算单元,计算用户对各个音频内容的偏好度评分,当音频内容的评分达到预设阈值时,作为候选推荐集合进入混合推荐模块。根据本专利技术的基于用户行为的音频个性化推荐系统的一实施例,混合推荐模块进一步包括:用户冷启动单元,通过收集用户的人口学数据,推荐符合特点的热播音频内容为猜你喜欢的音频;评分综合排序单元,将各种场景下的推荐候选音频内容进行综合排序;音频内容过滤单元,提出用户不喜欢的音频内容以及最近收听或订阅的音频内容;推荐展示单元,进行四个场景的推荐展示,包括猜你喜欢综合推荐、收听完成推荐、订阅成功推荐、找听友推荐。本专利技术对比现有技术有如下的有益效果:本专利技术是从用户的人口学特征和对音频内容的收听、订阅、点赞、评论等行为中挖掘用户对音频内容的潜在兴趣,并通过对音配内容被收听、订阅中挖掘音频内容的关系,结合音频内容间基于简介和标签建立的相关性,把被海量音频淹没的优质内容呈现给听众,为听众提供更好的个性化推荐服务。基于从用户数据和音频内容中提取的特征,计算用户对音频内容的评分,结合各种算法得出候选推荐项,并通过融合方法对推荐项进行重新排序,并对用户近期行为进行过滤,提高了用户对音频内容偏好度量的准确性。附图说明图1示出了本专利技术的基于用户行为的音频个性化推荐方法的较佳实施例的流程图。图2示出了本专利技术的基于用户行为的音频个性化推荐系统的较佳实施例的流程图。图3示出了计算音频内容的综合相关系数需要综合考虑的四种相关系数和相应的流程的示意图。图4示出了融合各场景的推荐结果,产生最终推荐结果的流程的示意图。具体实施方式在结合以下附图阅读本公开的实施例的详细描述之后本文档来自技高网...
一种基于用户行为的音频个性化推荐方法和系统

【技术保护点】
一种基于用户行为的音频个性化推荐方法,包括:步骤1:收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;步骤2:对所收集的用户行为数据进行清洗和整合;步骤3:基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;步骤4:基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。

【技术特征摘要】
1.一种基于用户行为的音频个性化推荐方法,包括:步骤1:收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;步骤2:对所收集的用户行为数据进行清洗和整合;步骤3:基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;步骤4:基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。2.根据权利要求1所述的基于用户行为的音频个性化推荐方法,其特征在于,步骤1中,用户的人口学特征包括用户的性别、年龄和地域,用户行为数据包括用户的登录行为数据、用户收听音频内容的时长和播放比例、用户订阅的音频内容、用户评论的音频内容,音频内容的特征属性包括音频内容的类别、简介、标签、发布规律和初始评分。3.根据权利要求1所述的基于用户行为的音频个性化推荐方法,其特征在于,步骤2进一步包括:对用户登录时间低于预设值且收听比例小于预设值的收听行为标记为误点击,从用户收听记录中删除;用户对特定音频内容的收听间隔进行划分,小于指定间隔的将两次收听整合在一起,用于描述用户特定时段的收听新区,对用户特定时段收听的类别和标签进行统计,取出出现频率最高的标记为用户时段偏好;进行时段划分,统计用户收听时段和时段偏好并做相应的标记;考察音频内容被收听的时段,统计其出现频率在前的时段并做相应的标记,补充为音频内容的标签;将用户当天对音频内容的收听行为按照收听时间和完播比例进行汇总,按照天数进行衰减,整合后的数据平衡考虑用户长短期的兴趣;剔除用户远期订阅行为数据。4.根据权利要求1所述的基于用户行为的音频个性化推荐方法,其特征在于,步骤3进一步包括:指定用户间互动较多的多个用户最近收听的音频内容作为给定用户基于社交关系的推荐候选音频内容;对用户收听历史进行分析,根据收听时间的长短,进行预评分;将用户收听历史相关性最大的多个音频内容选取为基于收听行为的候选音频内容集合;根据用户收听历史音频内容评分,结合音频内容之间的相关性,计算对优选音频内容的评分。5.根据权利要求1所述的基于用户行为的音频个性化推荐方法,其特征在于,步骤4进一步包括:基于每一音频内容的评分,将评分达到预定阈值的音频内容进行排序,并过滤掉用户最近收听和订阅的音频内容后,取得排名高于预设值的音频内容后,推送给用户。6.一种基于用户行为...

【专利技术属性】
技术研发人员:吕亚召
申请(专利权)人:上海证大喜马拉雅网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1