新闻数据的更新方法及装置制造方法及图纸

技术编号:15864115 阅读:78 留言:0更新日期:2017-07-23 08:52
本发明专利技术公开了一种新闻数据的更新方法及装置,至少能够解决现有技术中每次在对新闻数据进行更新时需获取所有新闻数据的更新时间,再对达到更新时间的新闻数据进行更新的过程中获取了大量无效数据的问题。其中,新闻数据的更新方法包括:将获取到的各个新闻数据依次存储为数据队列的各个队列元素;其中,每个队列元素中包含对应的新闻数据的更新时间;获取位于队首的队列元素中包含的更新时间,判断更新时间与当前时间之间的间隔是否满足预设的更新条件;当判断结果为是时,对位于队首的队列元素对应的新闻数据进行更新,并将位于队首的队列元素从队首删除后添加到队尾,且将添加到队尾的队列元素中包含的更新时间修改为当前时间。

【技术实现步骤摘要】
新闻数据的更新方法及装置
本专利技术涉及通信
,具体涉及一种新闻数据的更新方法及装置。
技术介绍
目前,从新闻数据源获得的数据在经过一系列的处理,如分类、敏感词过滤后形成一条条新闻数据,而这些新闻数据的属性,如表征其热度的权值属性等会随着时间而发生变化,例如,刚开始某条新闻为热点新闻,其权值系数较高,但随着时间的推移,其权值系数会不断地衰减,所以需定期地对这些新闻数据进行更新。在定期地对新闻数据进行更新时,可采用定时更新的方法,例如,新闻数据的更新周期为30分钟,则可以在0分、30分、60分(每隔30分的时间点)对所有新闻数据进行更新,然而,采用这种方法会使系统在更新时间点时负载过高,出现丢数据或数据延时等现象,而在两次更新时间点中间系统负载较小,从而出现资源浪费现象;并且,若新的新闻数据在两次更新时间点之间写入,如25分写入,则需要在55分时对该数据进行更新,而该种定时更新的方式则显然只能在30分或60分时对其进行更新,由此可见,定时更新方式的更新时间精度较低,无法精准地实现在新闻录入特定时间后进行更新的效果。为解决上述问题,技术人员采用非定时更新的方法,即更新时每次获取所有新闻数据的上次更新时间,将达到更新周期的新闻数据进行更新。然而,专利技术人在实现本专利技术的过程中发现,非定时更新的方式依然存在下述缺陷:在每次获取的新闻数据的更新时间中有较多的新闻数据未达到更新周期,从而使得获取了较多的无效数据,从而增大了系统工作量,增加了系统负载,并降低了新闻数据的更新速度。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的新闻数据的更新方法及装置。根据本专利技术的一个方面,提供了一种新闻数据的更新方法,包括:将获取到的各个新闻数据依次存储为数据队列的各个队列元素;其中,每个队列元素中包含对应的新闻数据的更新时间;获取位于队首的队列元素中包含的更新时间,判断所述更新时间与当前时间之间的间隔是否满足预设的更新条件;当判断结果为是时,对所述位于队首的队列元素对应的新闻数据进行更新,并将所述位于队首的队列元素从队首删除后添加到队尾,且将添加到队尾的队列元素中包含的更新时间修改为当前时间。根据本专利技术的另一个方面,提供了一种新闻数据的更新装置,包括:存储模块,适于将获取到的各个新闻数据依次存储为数据队列的各个队列元素;其中,每个队列元素中包含对应的新闻数据的更新时间;获取模块,适于获取位于队首的队列元素中包含的更新时间;第一判断模块,适于判断所述更新时间与当前时间之间的间隔是否满足预设的更新条件;更新模块,适于当第一判断模块判断结果为是时,对所述位于队首的队列元素对应的新闻数据进行更新,并将所述位于队首的队列元素从队首删除后添加到队尾,且将添加到队尾的队列元素中包含的更新时间修改为当前时间。在本专利技术提供的一种新闻数据的更新方法及装置中,通过将各个新闻数据依次存储为数据队列的各个队列元素,使各个新闻数据在时间上呈现顺序排列,在更新时间与当前时间之间的间隔满足预设的更新条件时,对位于队首的队列元素对应的新闻数据进行更新,并将位于队首的队列元素从队首删除后添加到队尾,且将添加到队尾的队列元素中包含的更新时间修改为当前时间,从而保证了在同一个数据队列中队首元素至队尾元素所包含的更新时间依次增加。由于同一个数据队列中的新闻数据的更新周期相同,则当判断了队首元素未满足更新条件时,则说明数据队列中的所有新闻数据均不满足更新条件,则不再获取剩余的新闻数据的更新时间,从而避免了现有技术中每次在对新闻数据进行更新时需获取所有新闻数据的更新时间而导致获取了大量无效数据的问题,从而取得了降低系统工作量及系统负载,提高新闻数据的更新速度的有益效果。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例提供的一种新闻数据的更新方法的流程图;图2示出了根据本专利技术另一个实施例提供的一种新闻数据的更新方法的流程图;图3示出了根据本专利技术一个实施例提供的一种新闻数据的更新装置的结构框图;图4示出了根据本专利技术另一个实施例提供的一种新闻数据的更新装置的结构框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术提供了一种新闻数据的更新方法及装置,至少能够解决现有技术中每次在对新闻数据进行更新时需获取所有新闻数据的更新时间而导致获取了大量无效数据的问题。图1示出了根据本专利技术一个实施例提供的一种新闻数据的更新方法的流程图,如图1所示,该方法包括:步骤S110,将获取到的各个新闻数据依次存储为数据队列的各个队列元素;其中,每个队列元素中包含对应的新闻数据的更新时间。在对新闻数据进行更新过程中,当其更新周期相同时,可按照新闻数据被获取的先后次序依次将其存储为数据队列的各个队列元素。其中,每个队列元素中包含有其对应的新闻数据的更新时间,该更新时间具体表示该条新闻数据上次更新的时间点,在该条新闻数据初次存储至数据队列中时,其更新时间为其初次存储至数据队列的时间。可选的,当新闻数据的更新周期不相同时。例如,娱乐热点新闻的热度随时间常常呈现指数下降,则需对新闻数据(包含新闻热度的相关信息)进行频繁的更新;而对一些时政类新闻,如房产新闻、物价新闻等其更新周期相对较长。所以对于更新周期不同的新闻数据,首先将新闻数据按更新周期进行分类,将同一更新周期的新闻数据划分为一类。并可将同一更新周期的新闻数据按次序依次存储为数据队列的各个队列元素。可选的,同一数据队列中的新闻数据的更新周期相同,但同一更新周期的新闻数据可以存储于不同的数据队列。例如,可将更新周期为10分钟的新闻数据按照获取的先后次序依次存储至同一数据队列,但当更新周期为10分钟的新闻数据过多时,考虑到数据队列的存储空间大小及新闻数据的更新效率,也可将更新周期为10分钟的新闻数据存储至多个数据队列中,但在同一个数据队列中,仍按照新闻数据获取的先后次序依次将其存储为数据队列的各个队列元素。进一步可选的,当含有多个数据队列时,可由多个线程来进行维护,多个线程可进行并发处理,从而提高新闻数据的更新效率。本实施例中将以一个数据队列为例来阐明新闻数据的更新过程。步骤S120,获取位于队首的队列元素中包含的更新时间,判断更新时间与当前时间之间的间隔是否满足预设的更新条件,若是,则执行步骤S130。其中,预设的更新条件可根据新闻数据的更新周期来确定。例如,预设的更新条件可以为更新时间与当前时间之间的间隔应大于或等于更新周期,若更新周期为5分钟,获取到的队首的队列元素中包含的更新时间为7分00本文档来自技高网...
新闻数据的更新方法及装置

【技术保护点】
一种新闻数据的更新方法,包括:将获取到的各个新闻数据依次存储为数据队列的各个队列元素;其中,每个队列元素中包含对应的新闻数据的更新时间;获取位于队首的队列元素中包含的更新时间,判断所述更新时间与当前时间之间的间隔是否满足预设的更新条件;当判断结果为是时,对所述位于队首的队列元素对应的新闻数据进行更新,并将所述位于队首的队列元素从队首删除后添加到队尾,且将添加到队尾的队列元素中包含的更新时间修改为当前时间。

【技术特征摘要】
1.一种新闻数据的更新方法,包括:将获取到的各个新闻数据依次存储为数据队列的各个队列元素;其中,每个队列元素中包含对应的新闻数据的更新时间;获取位于队首的队列元素中包含的更新时间,判断所述更新时间与当前时间之间的间隔是否满足预设的更新条件;当判断结果为是时,对所述位于队首的队列元素对应的新闻数据进行更新,并将所述位于队首的队列元素从队首删除后添加到队尾,且将添加到队尾的队列元素中包含的更新时间修改为当前时间。2.根据权利要求1所述的方法,其中,当判断结果为否时,等待预设时间后重新执行所述获取位于队首的队列元素中包含的更新时间的步骤及其后续步骤。3.根据权利要求1或2所述的方法,其中,所述等待预设时间的步骤具体包括:计算所述更新时间与当前时间之间的间隔与预设的更新间隔之间的差值,根据所述差值确定所述预设时间;或者,根据预设的第二时间间隔确定所述预设时间。4.根据权利要求1-3任一所述的方法,其中,每个队列元素中进一步包含对应的新闻数据的数据标识,且所述方法进一步包括步骤:将所述获取到的各个新闻数据存储到预设的存储空间,并为所述存储空间内存储的各个新闻数据设置对应的索引文件,所述索引文件的每个索引项中存储有对应的新闻数据的数据标识;则所述对所述位于队首的队列元素对应的新闻数据进行更新的步骤具体包括:根据所述位于队首的队列元素中包含的数据标识,从所述索引文件中查询与该队列元素中包含的新闻数据对应的索引项,根据查询到的索引项对所述存储空间内相应的新闻数据进行更新。5.根据权利要求1-4任一所述的方法,其中,所述对所述位于队首的队列元素对应的新闻数据进行更新的步骤具体包括:对所述位于队首的队...

【专利技术属性】
技术研发人员:朱超
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1