一种基于语音的信息推荐方法及系统技术方案

技术编号:20566685 阅读:25 留言:0更新日期:2019-03-14 09:28
本发明专利技术的技术方案包括一种基于语音的信息推荐方法及系统,用于实现:通过用户收听行为数据的收集、挖掘,给每条语音打分,系统包括采集单元、语音评估单元、语音推送单元以及模型构建单元,采集单元用于采集用户收听语音行为数据;语音评估单元用于根据采集单元采集的数据按照评估策略评估语音信息并生成可推荐列表;模型构建单元用于定时解析语音评估单元的数据不断优化推荐模型;语音推送单元用于根据模型构建单元建立的推送模型和可推荐列表,向用户推送优化后的推送内容。本发明专利技术的有益效果为:将高质量的内容推荐给用户,实现方式简单,人力成本低,不需要庞大的用户规模作为提取样本,待评估的数据只需语音信息即可,不需要海量的内容数据。

A Method and System of Information Recommendation Based on Voice

The technical scheme of the present invention includes a voice-based information recommendation method and system, which is used to realize: by collecting and mining user's listening behavior data, each voice is scored. The system includes acquisition unit, voice evaluation unit, voice push unit and model building unit, acquisition unit is used to collect user's listening voice behavior data; voice evaluation unit is used for root. According to the data collected by the acquisition unit, the voice information is evaluated according to the evaluation strategy and the recommendable list is generated; the model building unit is used to analyze the data of the voice evaluation unit in time and optimize the recommendation model continuously; the voice pushing unit is used to construct the push model and the recommendable list based on the model unit, and push the optimized push content to the user. The beneficial effect of the present invention is that the high quality content is recommended to the user, the realization method is simple, the labor cost is low, the huge user size is not needed as the extraction sample, the data to be evaluated only needs voice information, and the massive content data is not needed.

【技术实现步骤摘要】
一种基于语音的信息推荐方法及系统
本专利技术涉及一种基于语音的信息推荐方法及系统,属于信息处理领域。
技术介绍
随着数字广播技术以及通信技术的发展,语音成为了日常生活中必不可少的信息传递媒介,语音消息、电台以及音乐等等,都是平常生活中常见的语音消息,然而,正是由于日常生活中充斥着各类的语音消息,使得用户面对数量、种类繁多的语音消息难以选择,其次,繁杂的语音消息并不适合所有用户,部分用户非常抗拒接收某类语音消息,以音乐推送为例,音乐推荐包括基于音乐内容的推荐,基于音乐关联性的推荐,基于知识的推荐,协同过滤推荐等多种方式,目前采用的技术主要有:1、当接收到至少一个终端的音乐推荐请求时,获取至少一个终端的音乐偏好,一个终端对应至少一个音乐偏好;根据各个终端的音乐偏好,生成至少一个终端的共同音乐偏好;根据共同音乐偏好,向至少一个终端进行音乐推荐。2、在将歌曲建模为若干隐含主题概率分布的基础上将用户的收听行为建模为多维时间序列,进而通过多维时间序列分析的方法挖掘用户的行为习惯,并最终从候选歌曲数据库中为用户推荐合适的歌曲。3、在将歌曲建模为若干隐含主题概率分布的基础上将用户的收听行为建模为多维时间序列,进而通过多维时间序列分析的方法挖掘用户的行为习惯,并最终从候选歌曲数据库中为用户推荐合适的歌曲。现有技术主要集中在一些拥有海量数据的公司使用,他们基于用户的行为数据,还有其海量的内容数据库做精准内容推荐。这种推荐方式效果很好,但缺点主要有几点:1、实现方式极其复杂且时间人力成本高;2、需要庞大的用户规模;3、需要海量的内容数据;4、不适用于公司起步阶段;如何解决上述问题,成为了本领域技术人员较为关注的焦点。
技术实现思路
为解决上述问题,本专利技术的目的在于提供一种基于语音的信息推荐方法及系统,通过用户收听行为数据的收集、挖掘,给每条语音打分,系统包括采集单元、语音评估单元、语音推送单元以及模型构建单元,采集单元用于采集用户收听语音行为数据;语音评估单元用于根据采集单元采集的数据按照评估策略评估语音信息并生成可推荐列表;模型构建单元用于定时解析语音评估单元的数据不断优化推荐模型;语音推送单元用于根据模型构建单元建立的推送模型和可推荐列表,向用户推送优化后的推送内容。本专利技术解决其问题所采用的技术方案一方面是:一种基于语音的信息推荐方法,其特征在于,该方法包括以下步骤:向用户推送一批语音信息,其中推送模型包括编辑推荐、精选推荐以及新帖随机;采集用户的收听行为数据;以收听时长为评分标准对每一条语音的收听情况进行评估统计;定时根据评估统计后的结果进行评级,根据评估结果对语音信息进行升降级处理并向用户推送优化后的推送内容。进一步的,所述新帖随机包括当日发布的语音信息并将语音信息平均分发给用户。进一步的,所述新帖随机为未进行评估统计的语音信息。进一步的,所述采集用户的收听行为数据还包括以下步骤:读取用户播放日志;分析用户播放日志,得到用户行为特性,用户行为特性包括用户收听的语音名称、收听语音信息的时间、收听语音信息的时长、收听该语音信息的次数、收听该语音信息的用户ID、该语音信息的类型、该用户所处地理位置信息以及该用户注册时间。进一步的,所述以收听时长为评分标准对语音信息进行评估统计还包括以下步骤:根据用户收听语音信息的时长,按照评估策略进行评估分级打分,其中评估策略为将语音信息按照收听时长分为五个级别并定义对应的分数;对各个用户的语音收听行为进行排重,取每个用户的每条语音的最高分,并统计每条语音在每个用户的评级信息;根据每条语音的评分和每条语音在每个用户的评级信息,进行综合评分,将综合评分一定排名的语音作为当日可推荐列表,其中一定排名的语音可自定义设置。进一步的,所述可推荐列表用于向编辑推荐和精选推荐提供待筛选内容。本专利技术解决其问题所采用的技术方案另一方面是:一种基于语音的信息推荐系统,包括采集单元、语音评估单元、语音推送单元以及模型构建单元,其特征在于:所述采集单元用于采集用户收听语音行为数据;所述语音评估单元用于根据采集单元采集的数据按照评估策略评估每一条语音信息的综合得分数据并生成可推荐列表;所述语音推送单元用于根据模型构建单元建立的推送模型和可推荐列表,向用户推送优化后的推送内容;所述模型构建单元用于定时解析语音评估单元的数据不断优化推荐模型。进一步的,所述语音评估单元包括:语音获取单元,用于根据用户的收听行为数据构造“用户-语音-收听时长”三维矩阵;语音分级评估单元,用于展开三维矩阵并根据评估策略对各段语音进行评估分级打分;可推荐列表生成单元,用于根据语音分级评估单元对各段语音分级打分的结果,生成可推荐列表。本专利技术的有益效果是:本专利技术采用的一种基于信息推荐方法及系统,将质量好的内容推荐给用户,实现方式简单,人力成本低,不需要庞大的用户规模作为提取样本,待评估的数据只需语音信息即可,不需要海量的内容数据。附图说明图1所示为根据本专利技术的方法流程图;图2所示为根据本专利技术的具体实施例一;图3所示为根据本专利技术的系统结构图;图4所示为根据本专利技术的具体实施例二。具体实施方式以下将结合实施例和附图对本专利技术的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本专利技术的目的、方案和效果。需要说明的是,如无特殊说明,当某一特征被称为“固定”、“连接”在另一个特征,它可以直接固定、连接在另一个特征上,也可以间接地固定、连接在另一个特征上。此外,本公开中所使用的上、下、左、右等描述仅仅是相对于附图中本公开各组成部分的相互位置关系来说的。在本公开中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。此外,除非另有定义,本文所使用的所有的技术和科学术语与本
的技术人员通常理解的含义相同。本文说明书中所使用的术语只是为了描述具体的实施例,而不是为了限制本专利技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的组合。应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种元件,但这些元件不应限于这些术语。这些术语仅用来将同一类型的元件彼此区分开。例如,在不脱离本公开范围的情况下,第一元件也可以被称为第二元件,类似地,第二元件也可以被称为第一元件。本文所提供的任何以及所有实例或示例性语言(“例如”、“如”等)的使用仅意图更好地说明本专利技术的实施例,并且除非另外要求,否则不会对本专利技术的范围施加限制。参照图1所示为根据本专利技术的方法流程图,具体包括以下步骤:向用户推送一批语音信息,其中推送模型包括编辑推荐、精选推荐以及新帖随机。具体的推送方式可以是电台推送、APP推送等,通过服务器向终端推送待评估的语音信息,此处的新帖随机即为当日规定时间内新发布的并且尚未经过信息流推荐系统评估打分的语音信息。采集用户的收听行为数据。具体地说,当用户使用电台或APP进行语音收听时,服务器自动进行采样用户的收听行为,包括用户收听的语音名称、收听语音信息的时间、收听语音信息的时长、收听该语音信息的次数、收听该语音信息的用户ID、该语音信息的类型、该用户所处地理位置信息、该用户注册时间。其中,用户所处地理位置信息是指用户收听当前语音信息所在位置,关于这个位置我们可以通过网络地址获取,例如识别用户处于我本文档来自技高网
...

【技术保护点】
1.一种基于语音的信息推荐方法,其特征在于,该方法包括以下步骤:向用户推送一批语音信息,其中推送模型包括编辑推荐、精选推荐以及新帖随机;采集用户的收听行为数据;以收听时长为评分标准对每一条语音的收听情况进行评估统计;定时根据评估统计后的结果进行评级,根据评估结果对语音信息进行升降级处理并向用户推送优化后的推送内容。

【技术特征摘要】
1.一种基于语音的信息推荐方法,其特征在于,该方法包括以下步骤:向用户推送一批语音信息,其中推送模型包括编辑推荐、精选推荐以及新帖随机;采集用户的收听行为数据;以收听时长为评分标准对每一条语音的收听情况进行评估统计;定时根据评估统计后的结果进行评级,根据评估结果对语音信息进行升降级处理并向用户推送优化后的推送内容。2.根据权利要求1所述的基于语音的信息推荐方法,其特征在于,所述新帖随机包括当日发布的语音信息并将语音信息平均分发给用户。3.根据权利要求1所述的基于语音的信息推荐方法,其特征在于,所述新帖随机为未进行评估统计的语音信息。4.根据权利要求1所述的基于语音的信息推荐方法,其特征在于,所述采集用户的收听行为数据还包括以下步骤:读取用户播放日志;分析用户播放日志,得到用户行为特性,用户行为特性包括用户收听的语音名称、收听语音信息的时间、收听语音信息的时长、收听该语音信息的次数、收听该语音信息的用户ID、该语音信息的类型、该用户所处地理位置信息以及该用户注册时间。5.根据权利要求4所述的基于语音的信息推荐方法,其特征在于,所述以收听时长为评分标准对语音信息进行评估统计还包括以下步骤:根据用户收听语音信息的时长,按照评估策略进行评估分级打分,其中评估策略为将语音信息按照收听时长分为五个...

【专利技术属性】
技术研发人员:胡铭福
申请(专利权)人:珠海豆饭科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1