新闻展示方法和系统、计算机可读存储介质技术方案

技术编号:24331245 阅读:42 留言:0更新日期:2020-05-29 19:40
本发明专利技术提供了一种新闻展示方法和系统、计算机可读存储介质,其中新闻展示方法,包括:获取新闻稿件,解析新闻稿件以确定至少一个关键词,并根据关键词确定话题属性;确定预设时长内话题属性对应的浏览数据,根据浏览数据为话题属性进行排序,以得到话题热度序列;按照话题热度序列展示话题属性对应的新闻稿件。本申请提供的技术方案,一方面保证了所发布新闻稿件之间的相关性,另一方面可以对热点话题进行持续追踪,避免了话题偏移的问题。

News display method and system, computer readable storage medium

【技术实现步骤摘要】
新闻展示方法和系统、计算机可读存储介质
本专利技术涉及新闻话题追踪展示
,具体而言,涉及一种新闻展示方法、一种新闻展示系统和一种计算机可读存储介质。
技术介绍
在相关技术中,对于新闻话题追踪任务,给定少量的话题报道用作训练模型,数据的不足导致构造的话题模型很难完整表达话题,且当前常见的话题跟踪采用静态话题模型算法,它的设计思路一般是给出与新闻报道话题相关的训练报道,重点在于跟踪展示最新热点数据,而不是话题和新闻的匹配度。因此随着报道的逐渐增加,话题内容的连续性和相关度会逐渐降低,无法解决话题漂移的问题,导致最终展示的新闻相关性差,偏离热点话题。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。为此,本专利技术的第一方面提出一种新闻展示方法。本专利技术的第二方面提出一种新闻展示系统。本专利技术的第三方面提出一种计算机可读存储介质。有鉴于此,本专利技术的第一方面提供了一种新闻展示方法,包括:获取新闻稿件,解析新闻稿件以确定至少一个关键词,并根据关键词确定话题属性;确定预设时长内话题属性对应的浏览数据,根据浏览数据为话题属性进行排序,以得到话题热度序列;按照话题热度序列展示话题属性对应的新闻稿件。在该技术方案中,在获取到新闻稿件后,对新闻稿件进行解析操作,具体可以通过算法对新闻稿件进行拆分,遍历拆分出的词句以确定出新闻稿件的关键词,并根据关键词确定一个话题。此处,一个话题指的是一个新闻事件,相同的新闻事件具有相同的话题。举例来说,对于“A市B区X月Y日预计停电检修”这一新闻,由于新闻稿件撰写者不同,撰写角度不同,可能对该事件进行报道的多篇新闻稿件之间的差距很大,但这些稿件都包含有“A市B区”、“X月Y日”和“停电”的关键词,此处就可以将这些新闻均添加相同的话题属性。在添加话题属性时,可以由网站编辑人员在发稿时手动添加,也可以通过训练好的人工智能模型自动为新闻稿件添加话题属性。在确定话题属性后,确定预设时长内该话题属性对应的浏览数据,浏览数据表示了该话题在预设时长内的热度,因此根据浏览数据为话题属性进行排序,可得到多个话题属性的热度序列,并根据热度序列排序展示新闻稿件,进而在网站首页或新闻列表中优先展示热度较高的话题新闻。其中预设时长可根据统计的新闻热度周期,或发刊周期自由设定。应用了本专利技术提供的技术方案,通过在发布新闻稿件时,为每个新闻稿件添加话题属性,使话题属性与新闻稿件之间相关联,并通过话题属性将针对相同新闻事件的稿件进行归纳。并通过每个话题对应的浏览数据确定新闻时间的关注度和热度,从而实时的对热点话题事件进行追踪,使得读者用户可以了解当前热点,并对热点新闻稿件进行持续跟踪展示,便于读者用户掌握后续发展。本申请提供的技术方案,一方面保证了所发布新闻稿件之间的相关性,另一方面可以对热点话题进行持续追踪,避免了话题偏移的问题。另外,本专利技术提供的上述技术方案中的新闻展示方法还可以具有如下附加技术特征:在上述技术方案中,浏览数据包括浏览时长和浏览次数,根据浏览数据为话题属性进行排序的步骤,具体包括:按照浏览时长由长至短的顺序,和/或按照浏览次数由多至少的顺序对话题属性进行排序;和/或按照预设规则对话题属性进行排序。在该技术方案中,浏览数据包括浏览时长和浏览次数,其中浏览时长代表读者用户对一个话题属性对应的所有新闻稿件的阅读总时长,或平均阅读时长。浏览次数反映了一个话题属性对应的所有新闻稿件被点击浏览的总次数。浏览数据还可以包括以下数据中的一种或多种:独立访问量、转发量、评论量、点赞量。浏览时长、浏览次数、独立访问量、转发量、评论量和点赞量都能在一定程度上反应新闻话题的热度,因此在计算浏览数据时,可根据实际情况为上述数据设置相应的权重比,并进行相应计算。在一般情况下,浏览时长和浏览次数在浏览数据中所占的权重比较大,即浏览时长越长,浏览次数越多,则代表对应的话题属性的受关注度越高,越“热门”。同时,还可自由设置独立访问量、转发量、评论量和点赞量等其他浏览数据在热度表述中的权重比,并对话题属性进行排序,得到热度序列。在一些实施方式中,也可以根据需要设置预设规则,根据预设规则对新闻稿件进行主动排序,进而可以及时地主动追踪一些突发热点事件。在上述任一技术方案中,每个话题属性均对应于至少一个关键词,根据关键词确定话题属性的步骤,具体包括:获取历史话题属性集合,在历史话题属性集合中获取与关键词相对应的历史话题属性,并确定为话题属性。在该技术方案中,每个话题属性均对应于至少一个关键词,对于较复杂的新闻话题,关键词的数量可能是多个。在获取到一个新的新闻稿件,对其所述话题属性进行判断时,首先获取该新闻稿件的关键词,同时获取历史话题属性集合,该历史话题属性集合中囊括有一段时间内所有的新闻事件所对应的话题属性,遍历历史话题属性集合中的每一个话题属性,分别对其包括的关键词进行比对,进而可以得到与当前新闻稿件具有相同关键词的话题属性,将这些话题属性与当前新闻稿件进行关联,实现对新闻稿件的话题属性的确认。在上述任一技术方案中,基于历史话题属性集合中不存在与关键词对应的历史话题属性的情况,新闻展示方法还包括:根据关键词生成新增话题属性,并确定为话题属性;将新增话题属性加入历史话题属性集合。在该技术方案中,如果历史话题属性集合中没有与当前新闻稿件具有相同关键词的话题属性,则表明该新闻稿件报道了一个“新的”新闻事件,此时根据该新闻稿件对应的关键词生成一个新增话题属性,并添加至历史话题属性集合,以便于归类后续针对相同新闻时间的新闻稿件。在上述任一技术方案中,新闻展示方法还包括:接收针对新闻稿件的添加指令,根据添加指令确定新闻稿件对应的话题属性。在该技术方案中,管理员或编辑人员可通过添加指令为一个或多个新闻稿件手动添加对应的话题属性,一方面可以防止自动分配话题属性时出现误差,保证话题分配的主动性,另一方面可以通过主动添加话题属性的方式将一部分不具有相同关键词,但存在实际的相关性的新闻稿件进行归类展示。本专利技术第二方面提供了一种新闻展示系统,包括:存储器,存储器被配置为存储计算机程序;处理器,处理器被配置为执行计算机程序以实现:获取新闻稿件,解析新闻稿件以确定至少一个关键词,并根据关键词确定话题属性;确定预设时长内话题属性对应的浏览数据,根据浏览数据为话题属性进行排序,以得到话题热度序列;按照话题热度序列展示话题属性对应的新闻稿件。在该技术方案中,在获取到新闻稿件后,对新闻稿件进行解析操作,具体可以通过算法对新闻稿件进行拆分,遍历拆分出的词句以确定出新闻稿件的关键词,并根据关键词确定一个话题。此处,一个话题指的是一个新闻事件,相同的新闻事件具有相同的话题。举例来说,对于“A市B区X月Y日预计停电检修”这一新闻,由于新闻稿件撰写者不同,撰写角度不同,可能对该事件进行报道的多篇新闻稿件之间的差距很大,但这些稿件都包含有“A市B区”、“X月Y日”和“停电”的关键词,此处就可以将这些新闻均添加相同的话题属性本文档来自技高网...

【技术保护点】
1.一种新闻展示方法,其特征在于,包括:/n获取新闻稿件,解析所述新闻稿件以确定至少一个关键词,并根据所述关键词确定话题属性;/n确定预设时长内所述话题属性对应的浏览数据,根据所述浏览数据为所述话题属性进行排序,以得到话题热度序列;/n按照所述话题热度序列展示所述话题属性对应的所述新闻稿件。/n

【技术特征摘要】
1.一种新闻展示方法,其特征在于,包括:
获取新闻稿件,解析所述新闻稿件以确定至少一个关键词,并根据所述关键词确定话题属性;
确定预设时长内所述话题属性对应的浏览数据,根据所述浏览数据为所述话题属性进行排序,以得到话题热度序列;
按照所述话题热度序列展示所述话题属性对应的所述新闻稿件。


2.根据权利要求1所述的新闻展示方法,其特征在于,所述浏览数据包括浏览时长和浏览次数,所述根据所述浏览数据为所述话题属性进行排序的步骤,具体包括:
按照所述浏览时长由长至短的顺序,和/或按照所述浏览次数由多至少的顺序对所述话题属性进行排序;和/或
按照预设规则对所述话题属性进行排序。


3.根据权利要求2所述的新闻展示方法,其特征在于,每个所述话题属性均对应于至少一个所述关键词,所述根据所述关键词确定话题属性的步骤,具体包括:
获取历史话题属性集合,在所述历史话题属性集合中获取与所述关键词相对应的历史话题属性,并确定为所述话题属性。


4.根据权利要求3所述的新闻展示方法,其特征在于,基于所述历史话题属性集合中不存在与所述关键词对应的所述历史话题属性的情况,所述新闻展示方法还包括:
根据所述关键词生成新增话题属性,并确定为所述话题属性;
将所述新增话题属性加入所述历史话题属性集合。


5.根据权利要求1至4中任一项所述的新闻展示方法,其特征在于,还包括:
接收针对所述新闻稿件的添加指令,根据所述添加指令确定所述新闻稿件对应的所述话题属性。


6.一种新闻展示系统,其特征在于,包括:
存储器,所述存储器被配置为存储计算机程序;
处理器,所述处...

【专利技术属性】
技术研发人员:赵玉才
申请(专利权)人:北大方正集团有限公司北京北大方正电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1