一种基于在线自学习的个性化新闻投放系统及方法技术方案

技术编号:21004152 阅读:26 留言:0更新日期:2019-04-30 21:32
本发明专利技术涉及一种基于在线自学习的个性化新闻投放系统,新闻获取模块用于通过网络爬虫在网络上实时抓取新闻,将抓取到的新闻发送给预处理模块;预处理模块用于对抓取到的新闻进行预处理,并将预处理后的新闻发送到主题分类模块;主题分类模块用于对得到的新闻进行主题分类,并将分类后的新闻存储于数据库中;自学习用户行为建模模块用于通过记录用户读取新闻的经验来估计不同主题新闻对于用户的价值;新闻投放模块用于根据当前候选推荐新闻的价值排序向用户投放用户认为最有价值的新闻。本发明专利技术简化了传统推荐方法的复杂计算,在新闻投放上实现了个性化,提升了服务质量,减少了对于用户信息的依赖,实现了虚拟的用计算机模拟用户决策的过程。

【技术实现步骤摘要】
一种基于在线自学习的个性化新闻投放系统及方法
本专利技术涉及人工智能、机器学习、自然语言处理、数据挖掘和自适应控制领域,具体地说是一种基于在线自学习的个性化新闻投放系统及方法。
技术介绍
经历了20世纪末,从1995年到2001年的互联网泡沫,在21世纪初互联网重新焕发了生机,实现了快速的发展。随着各种互联网产品和网站的出现,比如淘宝、美团、58同城以及近来逐渐普及开来的网上外卖,可以说人们的衣食住行都与互联网紧密交织。不同于以前推送式的网络服务,现在的网络服务更多的注重用户体验以及用户的参与感。这与交互分不开,如何实现更智能的交互方式?当然人与人的交互是最自然的。如何使互联网也表现出类人的行为,这就需要互联网具有智能性。这种智能性体现在个性化的推送服务。现有的个性化推送方式需要对个人喜好建模。这种建模要么通过人为设计的特征来构造,要么需要用户提供大量的个人信息。人为设计的特征需要耗费大量的人力,另外这些特征往往带有主观判断,不一定能够准确描述个人的喜好。让用户在注册的时候输入大量个人信息,然后经过一些算法自动建模的方式虽然避免了人为设计的元素。但是输入用户信息,可能会涉及个人隐私问题。另外,用户可能也会因为输入信息太过繁琐而降低用户体验。还有一个问题是,这些模型往往是静态的,并不能动态的捕捉用户的兴趣点,从而更新原来的模型。
技术实现思路
针对现有技术的不足,本专利技术提供一种基于在线自学习的个性化新闻投放系统及方法。本专利技术为实现上述目的所采用的技术方案是:一种基于在线自学习的个性化新闻投放系统,包括:新闻获取模块,用于通过网络爬虫在网络上实时抓取新闻,将抓取到的新闻发送给预处理模块;预处理模块,用于对抓取到的新闻进行预处理,并将预处理后的新闻发送到主题分类模块;主题分类模块,用于对得到的新闻进行主题分类,并将分类后的新闻存储于数据库中;自学习用户行为建模模块,用于通过记录用户读取新闻的经验来估计不同主题新闻对于用户的价值;新闻投放模块,用于根据当前候选推荐新闻的价值排序向用户投放用户认为最有价值的新闻。所述主题分类模块包括人工标注单元和自动标注单元,人工标注单元用于通过人的主观判断对新闻进行主题标注;自动标注单元用于根据主题分类模型对新闻进行主题标注。所述自学习用户行为建模模块包括真实经验学习单元和模型学习单元;真实经验学习单元用于根据用户当前的新闻浏览行为对新闻价值进行估计;模型学习单元用于根据用户浏览习惯构建的用户喜好模型,产生模拟的浏览行为,并基于模拟的浏览行为进行新闻价值估计。所述经验包括用户主动读取主题新闻获得的经验以及初步根据用户行为,向用户推荐新闻获得的经验。所述新闻投放模块包括价值计算单元和决策单元;价值计算单元用于根据学习到的用户模型对推荐的新闻进行价值计算,即计算用户的喜好程度;决策单元包括贪婪决策单元和ε-贪婪决策单元,其中贪婪决策单元用于选择价值最大的新闻主题向用户推荐;ε-贪婪决策单元用于以ε的概率向用户随机推荐新闻主题,以1-ε的概率向用户推荐价值最大的新闻主题。还包括结果评估模块,对新闻投放模块的决策效果进行评估。一种基于在线自学习的个性化新闻投放方法,包括以下过程:步骤1:新闻获取模块通过网络爬虫在网络上实时抓取新闻,将抓取到的新闻发送给预处理模块;步骤2:通过预处理模块对抓取到的新闻进行预处理,并将预处理后的新闻发送到主题分类模块;步骤3:通过主题分类模块对得到的新闻进行主题分类,并将分类后的新闻存储于数据库中;步骤4:自学习用户行为建模模块根据用户当前的新闻浏览行为进行新闻价值估计以及通过用户浏览习惯构建用户喜好模型,产生模拟的浏览行为,并基于模拟的浏览行为进行新闻价值估计;步骤5:新闻投放模块根据当前候选推荐新闻的价值排序向用户投放用户认为最有价值的新闻。所述用户喜好模型包括用户浏览不同主题新闻s的转移概率分布Pss′和对某个主题新闻的喜好值R;其中对某个主题新闻s的喜好值R由某个主题新闻的浏览次数C(s)和该主题新闻的浏览时间T(s)决定:所述新闻价值估计包括:步骤1:初始化所有不同主题新闻的价值V为0;步骤2:建立一个空的列表Memory,用于保存状态转移序列和喜好值R;步骤3:从数据库Memory中抽取一个样本,更新相应主题新闻的价值V,更新表达式为:步骤4:循环迭代步骤3,直至前后两次不同主题新闻价值V的差值小于设定阈值。所述价值排序为根据不同主题新闻的价值V的由大到小进行排序。本专利技术具有以下有益效果及优点:1.本专利技术中用户行为建模中不直接构建用户的偏好特征向量,间接的通过新闻价值函数反映用户爱好;2.由于不直接对用户行为建模,不需要用户的个人资料,比如注册信息等,保护用户个人隐私;3.本专利技术中的学习是在线的学习,能够主动发觉用户的兴趣变化,更新模型;4.本专利技术可以在行为学习中同时利用实际经验和虚拟经验,可以快速的学习到用户的兴趣;附图说明图1是本专利技术的系统架构示意图;图2是本专利技术的新闻预处理过程图;图3是本专利技术的主题层次聚类示意图;图4是本专利技术的学习模型框架图;图5是本专利技术的自学习用户行为建模系统组成图;图6是本专利技术的计算V的记忆库Memory;图7是本专利技术的用户喜好模型图;图8是本专利技术的新闻投放过程图。具体实施方式下面结合附图及实施例对本专利技术做进一步的详细说明。如图1所示为本专利技术的系统架构示意图。该系统设有以下组成部件:新闻获取模块、前期预处理模块、主题分类模块、基于学习的用户行为建模模块、新闻投放模块以及用户体验评估,其中:新闻获取模块,负责采用网络爬虫在网络上实时抓取新闻,包括新闻的标题、新闻内容、新闻链接甚至是相关评论。预处理模块,用于对抓取的新闻初步处理,具体包括分词过滤、词性标注、特征提取以及文章的特征向量表示等。主题分类模块,主要用于对所获得的新闻进行主题的划分,划分方法包括人工标注法和机器自动标注法。人工标注法根据个人的主观判断和先验知识对新闻进行主题划分。机器自动标注法通过对预处理得到的文本特征向量进行聚类实现主题标注。聚类方式包括硬聚类和软聚类两种。在产生训练样本时本专利技术采用硬聚类,在对候选推荐样本进行聚类时采用软聚类。经过聚类后的文本被分割成不同主题的子集,存储于数据库。用表示第x个主题包含所有文本的平均特征向量。具体包括下列操作内容:聚类产生K个主题类;利用公式计算每个主题类的平均特征向量;经过聚类后的文本被分割成不同主题的子集,分别存储于数据库。自学习用户行为建模模块,主要通过记录用户读取新闻的经验来估计不同主题新闻对于用户的价值。经验包括2种,一种是用户浏览新闻获得的经验,另一种是由用户模型向用户推荐新闻获得的虚拟经验。两种经验都用于学习不同主题新闻的价值函数。具体包括真实经验学习单元、模型学习单元和价值估计单元。一个主题的新闻的价值定义为:Vπ(s)=R(s)+γ∑s′∈SPsa(s′)Vπ(s′),s′代表下一个浏览的新闻的主题类型。R(s)是某个用户对于某主题新闻的喜好值。第二项表示下个主题新闻的期望喜好值。可见某个主题新闻的价值是累积的,下个主题的新闻会影响前面的价值。这反映了新闻的引导作用。新闻投放模块,根据获得主题新闻价值和当前候选推荐新闻的价值排序向用户投放用户最感兴趣的新闻。包括价值计算单元、贪婪决策单元本文档来自技高网...

【技术保护点】
1.一种基于在线自学习的个性化新闻投放系统,其特征在于,包括:新闻获取模块,用于通过网络爬虫在网络上实时抓取新闻,将抓取到的新闻发送给预处理模块;预处理模块,用于对抓取到的新闻进行预处理,并将预处理后的新闻发送到主题分类模块;主题分类模块,用于对得到的新闻进行主题分类,并将分类后的新闻存储于数据库中;自学习用户行为建模模块,用于通过记录用户读取新闻的经验来估计不同主题新闻对于用户的价值;新闻投放模块,用于根据当前候选推荐新闻的价值排序向用户投放用户认为最有价值的新闻。

【技术特征摘要】
1.一种基于在线自学习的个性化新闻投放系统,其特征在于,包括:新闻获取模块,用于通过网络爬虫在网络上实时抓取新闻,将抓取到的新闻发送给预处理模块;预处理模块,用于对抓取到的新闻进行预处理,并将预处理后的新闻发送到主题分类模块;主题分类模块,用于对得到的新闻进行主题分类,并将分类后的新闻存储于数据库中;自学习用户行为建模模块,用于通过记录用户读取新闻的经验来估计不同主题新闻对于用户的价值;新闻投放模块,用于根据当前候选推荐新闻的价值排序向用户投放用户认为最有价值的新闻。2.根据权利要求1所述的基于在线自学习的个性化新闻投放系统,其特征在于:所述主题分类模块包括人工标注单元和自动标注单元,人工标注单元用于通过人的主观判断对新闻进行主题标注;自动标注单元用于根据主题分类模型对新闻进行主题标注。3.根据权利要求1所述的基于在线自学习的个性化新闻投放系统,其特征在于:所述自学习用户行为建模模块包括真实经验学习单元和模型学习单元;真实经验学习单元用于根据用户当前的新闻浏览行为对新闻价值进行估计;模型学习单元用于根据用户浏览习惯构建的用户喜好模型,产生模拟的浏览行为,并基于模拟的浏览行为进行新闻价值估计。4.根据权利要求1或3所述的基于在线自学习的个性化新闻投放系统,其特征在于:所述经验包括用户主动读取主题新闻获得的经验以及初步根据用户行为,向用户推荐新闻获得的经验。5.根据权利要求1所述的基于在线自学习的个性化新闻投放系统,其特征在于:所述新闻投放模块包括价值计算单元和决策单元;价值计算单元用于根据学习到的用户模型对推荐的新闻进行价值计算,即计算用户的喜好程度;决策单元包括贪婪决策单元和ε-贪婪决策单元,其中贪婪决策单元用于选择价值最大的新闻主题向用户推荐;ε-贪婪决策单元用于以ε的概率向用户随机推荐新闻主题,以1-...

【专利技术属性】
技术研发人员:张会文张伟冷雨泉陈正仓付明亮韩小宁蔺兆宝
申请(专利权)人:中国科学院沈阳自动化研究所
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1