新闻线索个性化推送方法及系统技术方案

技术编号:15447587 阅读:52 留言:0更新日期:2017-05-29 21:35
本申请公开一种新闻线索个性化推送方法及系统,该方法包括:步骤1,创建新闻线索领域的标签,为每个新闻线索领域分别训练一个新闻线索分类模型,使用所述新闻线索分类模型来对新闻线索候选集中的每条新闻线索进行分类,并存入对应领域的新闻线索集;步骤2,基于线索热度、时效性、和可信度建立新闻线索评分模型来对每个所述线索集中的每条新闻线索进行评分,选择得分最高的N条线索作为待推荐线索;步骤3,由用户从所述标签中选择自己感兴趣的新闻线索领域,然后将对应于所选兴趣领域的待推荐线索推送给用户。由此,能够根据用户群特点快速准确的从候选新闻线索集中找到用户需要的有价值的线索并进行推送。

Method and system for personalized push of news clues

The invention discloses a push method and system of personalized news clues, the method includes: Step 1, create news clues field labels for each field were trained in a news clue news clues classification model, using the classification model of news news clues to the candidate set each line of cable news clues for classification, and in the corresponding field of news set; step 2, clue heat, timeliness, and credibility of news clues to establish scoring model for each of the clues concentrated each news clues were selected based on the highest N clues as to recommend clues; step 3, by the user from the tag to choose their own interested in news clues, then corresponding to the selected area of interest to be recommended for clues to users. Thus, according to the characteristics of the user group, the valuable clues needed by the user can be quickly and accurately collected from the candidate news clues and pushed.

【技术实现步骤摘要】
新闻线索个性化推送方法及系统
本专利技术属于信息传递
,特别涉及一种新闻线索个性化推送方法及系统。
技术介绍
随着全民参与的互联网模式的发展,新闻媒体也在逐渐变革,传统媒体基于人才优势和品牌优势提供独家、独到、专业的新闻内容,再辅以多样化的传播渠道,就能占领新闻传播的制高点,而如今互联网上信息越来越充裕,如何在充足的线索中,根据用户群特点快速准确的从候选新闻线索集中找到用户需要的有价值的线索并进行推送具有重要意义。专利文件1(公开号为CN101694659A)公开了一种基于多主题追踪的个性化网络新闻推送方法,根据划分并维护多个用户子兴趣模型,选取与所有子兴趣模型的最高相似度最大的新闻报道推荐给用户,达到涵盖用户多种兴趣特征、推荐准确率高、系统后续维护负担轻的特点。专利文件2(公开号为CN104462578A)公开了一种新闻推送方法,根据制定人群的浏览情况选择新闻使推送用户能够接收到指定群体最关注,或者是影响力最大的新闻,从而准确的拓宽了推送用户的接收新闻的种类,并且准确的使用户接收到的应当了解的新闻。专利文件3(公开号为CN104090990A)公开了一种新闻推送方法和系统,根据计算用户对多个目标新闻类别的兴趣权重值,根据该权重调整不同目标新闻类别的推送比例新闻推送,达到为用户呈现更多样化的内容,引导用户调整个人兴趣,使用户及时发现新的兴趣,更全面地展现新闻内容的特点。但是上述现有技术主要通过新闻与用户兴趣匹配程度、关联用户浏览情况来选取带推送新闻,不能利用新闻线索本身的特点来发现最有推送价值的新闻线索。
技术实现思路
为了解决上述问题,本专利技术的目的在于,对新闻线索进行个性化推送,根据用户群特点快速准确的从候选新闻线索集中找到用户需要的有价值的线索并进行推送,其中新闻线索是指新闻事件的简介,包含事件简单描述和事件起止时间。本专利技术对大量线索候选集进行兴趣领域分类,使用提出的排序衡量标准选择得分最高的线索列表推送给用户,保证用户尽快获得其感兴趣的新闻线索。本专利技术的新闻线索个性化推送方法,包括:步骤1,创建新闻线索领域的标签,为每个所述新闻线索领域分别训练一个新闻线索的分类模型,使用所述分类模型对新闻线索候选集中的每条新闻线索进行新闻线索领域分类,存入对应领域的新闻线索集;步骤2,基于新闻线索的热度、时效性、和可信度建立新闻线索的评分模型来对每个所述新闻线索集中的每条新闻线索进行评分,每个所述新闻线索集中均选择得分最高的N条新闻线索作为待推荐线索,N的取值可根据需求自行设定;步骤3,由用户从所述标签中选择自己感兴趣的一个或多个新闻线索领域,然后将对应于用户选择的新闻线索领域的所述新闻线索集中的所述待推荐线索推送给用户。本专利技术的新闻线索个性化推送方法,进一步包括:步骤4,在客户端为每条推送的新闻线索提供打分功能,在用户打分后将对应的新闻线索和打分结果上传至系统服务器,根据所述打分结果更新对应的新闻线索的可信度得分。本专利技术的新闻线索个性化推送方法,其中,所述步骤1中,利用二值分类器根据每个所述新闻线索领域分别建立一个新闻线索的分类模型,分别用每个所述分类模型来对新闻线索候选集中的每条新闻线索进行新闻线索领域分类,当有m个分类模型将某条新闻线索分类为真时,则取这m个所述分类模型所对应的m个新闻线索领域作为该条新闻线索所属的领域,其中m为正整数。本专利技术的新闻线索个性化推送方法,其中,所述步骤2中,所述线索热度根据新闻线索在搜索引擎中得到的相关结果数来计算;所述时效性根据新闻线索的发现时间与当前时间的时间差计算;所述可信度根据新闻线索发现的来源计算;所述新闻线索的评分模型为:其中Vi为新闻线索CSi的综合得分,Ci为搜索引擎得到的相关结果数,ΔTi为新闻线索发现时间与当前时间的时间差,单位为小时,avg(ΔT)为所有新闻线索发现时间与当前时间的时间差的平均值,SRi表示新闻线索CSi对应的来源Ri的可信度得分,α、β、γ分别为所述新闻线索CSi的线索热度、时效性、可信度的权重系数。本专利技术的新闻线索个性化推送方法,其中,所述步骤4进一步为,建立新闻线索的可信度评分更新模型用于根据用户的打分结果计算更新后的可信度得分SRi',并用该SRi'代替公式(1)中的SRi来更新新闻线索评分模型,其中所述可信度评分更新模型为,SRi'=μ·SRi+(1-μ)·avg(Si)(2)Si表示新闻线索来源Ri对应的新闻线索打分集合,μ为调节因子,取值范围[0,1]。另外,本专利技术还提供一种新闻线索个性化推送系统,包括:分类模块,用于创建新闻线索领域的标签,为每个所述新闻线索领域分别训练一个新闻线索的分类模型,使用所述分类模型对新闻线索候选集中的每条新闻线索进行新闻线索领域分类,存入对应领域的新闻线索集;评分模块,用于基于新闻线索的热度、时效性、和可信度建立新闻线索的评分模型来对每个所述新闻线索集中的每条新闻线索进行评分,每个所述新闻线索集中均选择得分最高的N条新闻线索作为待推荐线索,N的取值可根据需求自行设定;推送模块,用于由用户从所述标签中选择自己感兴趣的一个或多个新闻线索领域,然后将对应于用户选择的新闻线索领域的所述新闻线索集中的所述待推荐线索推送给用户。本专利技术的新闻线索个性化推送系统,进一步包括:反馈模块,用于在客户端为每条推送的新闻线索提供打分功能,在用户打分后将对应的新闻线索和打分结果上传至系统服务器,根据所述打分结果更新对应的新闻线索的可信度得分。本专利技术的新闻线索个性化推送系统,其中,所述分类模块进一步包括:分类器判别模块,利用二值分类器根据每个所述新闻线索领域分别建立一个新闻线索的分类模型,分别用每个所述分类模型来对新闻线索候选集中的每条新闻线索进行新闻线索领域分类,当有m个分类模型将某条新闻线索分类为真时,则取这m个所述分类模型所对应的m个新闻线索领域作为该条新闻线索所属的领域,其中m为正整数。本专利技术的新闻线索个性化推送系统,其中,所述评分模块中,根据新闻线索在搜索引擎中得到的相关结果数来计算所述线索热度,根据新闻线索的发现时间与当前时间的时间差来计算所述时效性,根据新闻线索发现的来源来计算所述可信度;所述评分模块采用如下模型对新闻线索进行评分:其中Vi为新闻线索CSi的综合得分,Ci为搜索引擎得到的相关结果数,ΔTi为新闻线索发现时间与当前时间的时间差,单位为小时,avg(ΔT)为所有新闻线索发现时间与当前时间的时间差的平均值,SRi表示新闻线索CSi对应的来源Ri的可信度得分,α、β、γ分别为所述新闻线索CSi的线索热度、时效性、可信度的权重系数。本专利技术的新闻线索个性化推送系统,其中,所述反馈模块进一步包括可信度评分更新模块,所述可信度评分更新模块建立可信度评分更新模型用于根据用户的打分结果计算更新后的新闻线索的可信度得分SRi',并用该SRi'代替公式(1)中的SRi来更新新闻线索的评分模型,其中所述可信度评分更新模型为,SRi'=μ·SRi+(1-μ)·avg(Si)(2)Si表示新闻线索来源Ri对应的新闻线索打分集合,μ为调节因子,取值范围[0,1]。本专利技术的效果如下:(1)为用户提供兴趣领域的选择功能,根据用户选择的兴趣领域选择待推送的线索。(2)能够对新闻线索进行自动分类。本文档来自技高网...
新闻线索个性化推送方法及系统

【技术保护点】
一种新闻线索个性化推送方法,其特征在于,包括:步骤1,创建新闻线索领域的标签,为每个所述新闻线索领域分别训练一个新闻线索的分类模型,使用所述分类模型对新闻线索候选集中的每条新闻线索进行新闻线索领域分类,存入对应领域的新闻线索集;步骤2,基于新闻线索的热度、时效性、和可信度建立新闻线索的评分模型来对每个所述新闻线索集中的每条新闻线索进行评分,每个所述新闻线索集中均选择得分最高的N条新闻线索作为待推荐线索,N的取值可根据需求自行设定;步骤3,由用户从所述标签中选择自己感兴趣的一个或多个新闻线索领域,然后将对应于用户选择的新闻线索领域的所述新闻线索集中的所述待推荐线索推送给用户。

【技术特征摘要】
1.一种新闻线索个性化推送方法,其特征在于,包括:步骤1,创建新闻线索领域的标签,为每个所述新闻线索领域分别训练一个新闻线索的分类模型,使用所述分类模型对新闻线索候选集中的每条新闻线索进行新闻线索领域分类,存入对应领域的新闻线索集;步骤2,基于新闻线索的热度、时效性、和可信度建立新闻线索的评分模型来对每个所述新闻线索集中的每条新闻线索进行评分,每个所述新闻线索集中均选择得分最高的N条新闻线索作为待推荐线索,N的取值可根据需求自行设定;步骤3,由用户从所述标签中选择自己感兴趣的一个或多个新闻线索领域,然后将对应于用户选择的新闻线索领域的所述新闻线索集中的所述待推荐线索推送给用户。2.根据权利要求1所述的新闻线索个性化推送方法,其特征在于,所述方法进一步包括:步骤4,在客户端为每条推送的新闻线索提供打分功能,在用户打分后将对应的新闻线索和打分结果上传至系统服务器,根据所述打分结果更新对应的新闻线索的可信度得分。3.根据权利要求1所述的新闻线索个性化推送方法,其特征在于,所述步骤1中,利用二值分类器根据每个所述新闻线索领域分别建立一个新闻线索的分类模型,分别用每个所述分类模型来对新闻线索候选集中的每条新闻线索进行新闻线索领域分类,当有m个分类模型将某条新闻线索分类为真时,则取这m个所述分类模型所对应的m个新闻线索领域作为该条新闻线索所属的领域,其中m为正整数。4.根据权利要求1所述的新闻线索个性化推送方法,其特征在于,所述步骤2中,所述线索热度根据新闻线索在搜索引擎中得到的相关结果数来计算;所述时效性根据新闻线索的发现时间与当前时间的时间差计算;所述可信度根据新闻线索发现的来源计算;所述新闻线索的评分模型为:其中Vi为新闻线索CSi的综合得分,Ci为搜索引擎得到的相关结果数,ΔTi为新闻线索发现时间与当前时间的时间差,单位为小时,avg(ΔT)为所有新闻线索发现时间与当前时间的时间差的平均值,SRi表示新闻线索CSi对应的来源Ri的可信度得分,α、β、γ分别为所述新闻线索CSi的线索热度、时效性、可信度的权重系数。5.根据权利要求2或4所述的新闻线索个性化推送方法,其特征在于,所述步骤4进一步为,建立新闻线索的可信度评分更新模型用于根据用户的打分结果计算更新后的可信度得分SRi',并用该SRi'代替公式(1)中的SRi来更新新闻线索评分模型,其中所述可信度评分更新模型为,SRi'=μ·SRi+(1-μ)·avg(Si)(2)Si表示新闻线索来源Ri对应的新闻线索打分集合,μ为调节因子,取值范围[0,1]。6.一种新闻线索个性化推送系统,其特征在于,包括:分类模块,...

【专利技术属性】
技术研发人员:曹娟张勇东张俊强李锦涛
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1