资讯推荐方法及装置制造方法及图纸

技术编号:16718040 阅读:23 留言:0更新日期:2017-12-05 16:26
本发明专利技术公开了一种资讯推荐方法,包括步骤:实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。

Information recommendation methods and devices

The invention discloses an information recommendation method, comprising the steps of: collecting real-time user behavior log, label extraction points to the behavior log by tag engine information, thereby generating a first tag set; the user attributes, including user habits and interests attribute attribute; the first attribute of the tag set of interest based on the user's habits, and based on the attribute of the user behavior log; feature extraction based on the user attributes, attributes and attributes of interest habit, dynamic identification of the user categories, according to the user categories to the user to recommend the appropriate information, to achieve the user log based on Web for information recommendation, and can complete the personalized recommendation based on user interest measure.

【技术实现步骤摘要】
资讯推荐方法及装置
本专利技术涉及计算机领域,尤其涉及一种资讯推荐方法及装置。
技术介绍
随着互联网的迅猛发展,每天有大量网页在互联网上更新或者发布。对于广大用户来说在大量的信息中想找到自己满意的信息已经是越来越困难,从而导致了“信息过量”与“信息饥饿”的矛盾现象。为解决这一问题,提出了个性化信息服务,这是一种智能信息服务方式。可以根据用户的信息需求和个性化模式,主动搜寻相关信息,并且利用在线智能推荐服务或者推送技术,准确的将用户所需的信息传送到相应的用户。在个性化服务技术中,应用较成功的是协同过滤方法。该方法是指用户根据自身的需求,通过和其他用户进行合作,形成一定的协作规则,或利用多个信息使用者的倾向性来预测单个用户的兴趣,然后根据具有相同兴趣爱好的用户对信息进行评价,从而得到推荐结果。由于Web日志中记录了大量的用户行为信息,利用Web日志可以为个性化服务提供重要的数据支持。另外,在用户兴趣度量方面,目前存在的从访问日志文件中提取用户的访问模式进行推荐的方法,没有考虑到用户访问页面的时间特性。
技术实现思路
本专利技术实施例的目的是提供一种资讯推荐方法,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。为实现上述目的,本专利技术实施例提供了一种资讯推荐方法,包括步骤:实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。与现有技术相比,本专利技术公开的资讯推荐方法通过实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。作为上述方案的改进,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集具体为:收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。作为上述方案的改进,还包括步骤:根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。作为上述方案的改进,实时收集用户的行为日志具体为:通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。作为上述方案的改进,基于所述行为日志获得所述用户的习惯属性具体为:对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。本专利技术实施例还提供了一种资讯推荐装置,包括:收集模块,用于实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;属性获取模块,用于基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;第一推荐模块,用于根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。与现有技术相比,本专利技术公开的资讯推荐装置通过收集模块实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后通过属性获取模块基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再通过第一推荐模块根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。作为上述方案的改进,收集模块包括:第一识别模块,用于收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;第一标签集获取模块,用于识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;第二识别模块,用于根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。作为上述方案的改进,还包括:第二推荐模块,用于根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。作为上述方案的改进,所述收集模块具体用于通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。作为上述方案的改进,所述属性获取模块具体用于对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。附图说明图1是本专利技术实施例1中一种资讯推荐方法的流程示意图。图2是本专利技术实施例2中一种资讯推荐方法的流程示意图。图3是本专利技术实施例3中一种资讯推荐装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,是本专利技术实施例1提供的一种资讯推荐方法的流程示意图,包括步骤:S1、实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;其中,海量用户行为日志的入库是通过高负载的消息中间件进行数据传输。S2、基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;S3、根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。具体实施时,先实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。在一优选实施例中,步骤S1中通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集具体包括步骤:S11、收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;S12、识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;S13、根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。其中,粒度划分是通过LDA(主题模型)实现的。通过上述步骤,能实现自动化抽取和不同粒度本文档来自技高网...
资讯推荐方法及装置

【技术保护点】
一种资讯推荐方法,其特征在于,包括步骤:实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。

【技术特征摘要】
1.一种资讯推荐方法,其特征在于,包括步骤:实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。2.如权利要求1所述的资讯推荐方法,其特征在于,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集具体为:收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。3.如权利要求2所述的资讯推荐方法,其特征在于,还包括步骤:根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。4.如权利要求1所述的资讯推荐方法,其特征在于,实时收集用户的行为日志具体为:通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。5.如权利要求1所述的资讯推荐方法,其特征在于,基于所述行为日志获得所述用户的习惯属性具体为:对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。6.一种资讯推荐...

【专利技术属性】
技术研发人员:晋彤李永康
申请(专利权)人:广州特道信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1