一种基于在线自学习的个性化新闻投放系统及方法技术方案

技术编号：21004152 阅读：26 留言：0更新日期：2019-04-30 21:32

本发明专利技术涉及一种基于在线自学习的个性化新闻投放系统，新闻获取模块用于通过网络爬虫在网络上实时抓取新闻，将抓取到的新闻发送给预处理模块；预处理模块用于对抓取到的新闻进行预处理，并将预处理后的新闻发送到主题分类模块；主题分类模块用于对得到的新闻进行主题分类，并将分类后的新闻存储于数据库中；自学习用户行为建模模块用于通过记录用户读取新闻的经验来估计不同主题新闻对于用户的价值；新闻投放模块用于根据当前候选推荐新闻的价值排序向用户投放用户认为最有价值的新闻。本发明专利技术简化了传统推荐方法的复杂计算，在新闻投放上实现了个性化，提升了服务质量，减少了对于用户信息的依赖，实现了虚拟的用计算机模拟用户决策的过程。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于在线自学习的个性化新闻投放系统及方法
本专利技术涉及人工智能、机器学习、自然语言处理、数据挖掘和自适应控制领域，具体地说是一种基于在线自学习的个性化新闻投放系统及方法。
技术介绍
经历了20世纪末，从1995年到2001年的互联网泡沫，在21世纪初互联网重新焕发了生机，实现了快速的发展。随着各种互联网产品和网站的出现，比如淘宝、美团、58同城以及近来逐渐普及开来的网上外卖，可以说人们的衣食住行都与互联网紧密交织。不同于以前推送式的网络服务，现在的网络服务更多的注重用户体验以及用户的参与感。这与交互分不开，如何实现更智能的交互方式？当然人与人的交互是最自然的。如何使互联网也表现出类人的行为，这就需要互联网具有智能性。这种智能性体现在个性化的推送服务。现有的个性化推送方式需要对个人喜好建模。这种建模要么通过人为设计的特征来构造，要么需要用户提供大量的个人信息。人为设计的特征需要耗费大量的人力，另外这些特征往往带有主观判断，不一定能够准确描述个人的喜好。让用户在注册的时候输入大量个人信息，然后经过一些算法自动建模的方式虽然避免了人为设计的元素。但是输入用户信息，可能会涉及个人隐私问题。另外，用户可能也会因为输入信息太过繁琐而降低用户体验。还有一个问题是，这些模型往往是静态的，并不能动态的捕捉用户的兴趣点，从而更新原来的模型。
技术实现思路
针对现有技术的不足，本专利技术提供一种基于在线自学习的个性化新闻投放系统及方法。本专利技术为实现上述目的所采用的技术方案是：一种基于在线自学习的个性化新闻投放系统，包括：新闻获取模块，用于通过网络爬虫在网络上实时抓取新闻，...

【技术保护点】
1.一种基于在线自学习的个性化新闻投放系统，其特征在于，包括：新闻获取模块，用于通过网络爬虫在网络上实时抓取新闻，将抓取到的新闻发送给预处理模块；预处理模块，用于对抓取到的新闻进行预处理，并将预处理后的新闻发送到主题分类模块；主题分类模块，用于对得到的新闻进行主题分类，并将分类后的新闻存储于数据库中；自学习用户行为建模模块，用于通过记录用户读取新闻的经验来估计不同主题新闻对于用户的价值；新闻投放模块，用于根据当前候选推荐新闻的价值排序向用户投放用户认为最有价值的新闻。

【技术特征摘要】
1.一种基于在线自学习的个性化新闻投放系统，其特征在于，包括：新闻获取模块，用于通过网络爬虫在网络上实时抓取新闻，将抓取到的新闻发送给预处理模块；预处理模块，用于对抓取到的新闻进行预处理，并将预处理后的新闻发送到主题分类模块；主题分类模块，用于对得到的新闻进行主题分类，并将分类后的新闻存储于数据库中；自学习用户行为建模模块，用于通过记录用户读取新闻的经验来估计不同主题新闻对于用户的价值；新闻投放模块，用于根据当前候选推荐新闻的价值排序向用户投放用户认为最有价值的新闻。2.根据权利要求1所述的基于在线自学习的个性化新闻投放系统，其特征在于：所述主题分类模块包括人工标注单元和自动标注单元，人工标注单元用于通过人的主观判断对新闻进行主题标注；自动标注单元用于根据主题分类模型对新闻进行主题标注。3.根据权利要求1所述的基于在线自学习的个性化新闻投放系统，其特征在于：所述自学习用户行为建模模块包括真实经验学习单元和模型学习单元；真实经验学习单元用于根据用户当前的新闻浏览行为对新闻价值进行估计；模型学习单元用于根据用户浏览习惯构建的用户喜好模型，产生模拟的浏览行为，并基于模拟的浏览行为进行新闻价值估计。4.根据权利要求1或3所述的基于在线自学习的个性化新闻投放系统，其特征在于：所述经验包括用户主动读取主题新闻获得的经验以及初步根据用户行为，向用户推荐新闻获得的经验。5.根据权利要求1所述的基于在线自学习的个性化新闻投放系统，其特征在于：所述新闻投放模块包括价值计算单元和决策单元；价值计算单元用于根据学习到的用户模型对推荐的新闻进行价值计算，即计算用户的喜好程度；决策单元包括贪婪决策单元和ε-贪婪决策单元，其中贪婪决策单元用于选择价值最大的新闻主题向用户推荐；ε-贪婪决策单元用于以ε的概率向用户随机推荐新闻主题，以1-...

【专利技术属性】
技术研发人员：张会文，张伟，冷雨泉，陈正仓，付明亮，韩小宁，蔺兆宝，
申请(专利权)人：中国科学院沈阳自动化研究所，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人