一种基于在线学习的网络资源推荐方法及装置制造方法及图纸

技术编号：11003459 阅读：75 留言：0更新日期：2015-02-05 03:40

本发明专利技术实施例公开了一种基于在线学习的网络资源推荐方法及装置，该方法包括：根据用户针对展示的网络资源的反馈日志，对用于推荐网络资源的数据模型进行训练；基于所述数据模型对需要推荐的网络资源按照E&E算法进行打分和推荐；对推荐的网络资源进行展示。本发明专利技术实施例以用户的反馈来训练数据模型，实现对数据模型进行快速反复的迭代，能提高推荐策略的反应速度和推荐的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
-种基于在线学习的网络资源推荐方法及装置
本专利技术涉及互联网
，具体涉及一种基于在线学习的网络资源推荐方法及装置。
技术介绍
在视频，搜索，影视资源网站，互联网搜索引擎，W及推荐引擎（包括新闻推荐，商品推荐，广告推荐等）等领域，通常遇到的问题是互联网资源较多，但是资源竞争问题决定仅仅只有有限的互联网资源能够得W展现给用户，因此如何选择合适的互联网资源推荐给用户是比较重要的问题。现有技术中，网络设备向用户推荐互联网资源时，往往是对资源按照用户行为等信息进行权重计算，再根据权重排名选择推荐信息，但是，该种现有的互联网资源推荐过程中，专利技术人发现存在W下问题；推荐的信息趋于集中和固定，某些新的或冷口的互联网资源因为参照的结果信息的缺失而得不到推荐。
技术实现思路
有鉴于此，本专利技术实施例提供一种基于在线学习的网络资源推荐方法及装置，W 提高推荐策略的反应速度和推荐的准确率。第一方面，本专利技术实施例提供了一种基于在线学习的网络资源推荐方法，包括：根据用户针对展示的网络资源的反馈日志，对用于推荐网络资源的数据模型进行训练；基于所述数据模型对需要推荐的网络资源按照E&E算法进行打分和推荐；对推荐的网络资源进行展示。第二方面，本专利技术实施例还提供了一种基于在线学习的网络资源推荐装置，包括：模型训练单元，用于根据用户针对展示的网络资源的反馈日志，对用于推荐网络资源的数据模型进行训练；资源推荐单元，用于基于所述数据模型对需要推荐的网络资源按照...
一种基于在线学习的网络资源推荐方法及装置

【技术保护点】
一种基于在线学习的网络资源推荐方法，其特征在于，包括：根据用户针对展示的网络资源的反馈日志，对用于推荐网络资源的数据模型进行训练；基于所述数据模型对需要推荐的网络资源按照E&E算法进行打分和推荐；对推荐的网络资源进行展示。

【技术特征摘要】
1. 一种基于在线学习的网络资源推荐方法，其特征在于，包括：根据用户针对展示的网络资源的反馈日志，对用于推荐网络资源的数据模型进行训练；基于所述数据模型对需要推荐的网络资源按照E&E算法进行打分和推荐；对推荐的网络资源进行展示。2. 根据权利要求1所述的方法，其特征在于，按照E&E算法进行打分和推荐的操作具体包括：按照e -greedy算法、置信度上界UCB算法、抽样方法算法、Ranked Bandits算法、 Contextual Bandits算法、和Reinforcement Learning算法中的一种算法、或两种以上算法相结合，进行打分和推荐。3. 根据权利要求1或2所述的方法，其特征在于，根据用户针对展示的网络资源的反馈日志，对用于推荐网络资源的数据模型进行训练的操作具体包括：获取用户对展示的网络资源的反馈日志，其中所述反馈日志包括用户行为信息；将所述反馈日志进行预处理形成结构化的数据样本；根据所述数据样本对用于推荐网络资源的数据模型进行训练。4. 根据权利要求3所述的方法，其特征在于，获取用户对推荐的网络资源的反馈日志的操作具体包括：通过实时的方式或按照周期获取用户对推荐的网络资源的反馈日志。5. 根据权利要求3所述的方法，其特征在于，将所述反馈日志进行预处理形成结构化的数据样本的操作具体包括：从所述反馈日志中查询用户的静态属性和当前的动态属性；计算所述展示的网络资源的预设维度的权值；将用户的静态属性和当前的动态属性，以及所述展示的网络资源在各预设维度的权值，拟合成结构化的收益/损失数据，作为数据样本。6. 根据权利要求3所述的方法，其特征在于，所述用户行为信息包括对网络资源的点击、下载和/或浏览。7. 根据权利要求3所述的方法，其特征在于，所述反馈日志还包括用户信息。8. 根据权利要求7所述的方法，其特征在于，所述用户信息包括用户ID、...

【专利技术属性】
技术研发人员：王凡，田浩，徐倩，陈立，信贤卫，吴泽衡，周方圆，郑德荣，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人