一种文章收录方法及装置制造方法及图纸

技术编号:16819235 阅读:19 留言:0更新日期:2017-12-16 12:43
本发明专利技术实施例提供了一种文章收录方法及装置,方法包括:使用预设的收录脚本,从预设的任务列表中获取待处理文章,所述任务列表包括至少一篇属于预设主题的待处理文章;在获取所述待处理文章之后,从所述任务列表中删除所述待处理文章;使用所述收录脚本,判断所述待处理文章是否已经收录在所述预设主题中;若所述待处理文章尚未收录在所述预设主题中,使用所述收录脚本,将所述待处理文章收录在所述预设主题中。应用本发明专利技术实施例能够提高收录脚本对文章的收录效率。

An article collection method and device

The embodiment of the invention provides a method and a device included in this article, the method includes: the default script included, to get the treatment from the perspective of the task list, the list of tasks including at least one belonging to the default theme to be processed after obtaining the articles; to be processed articles, to delete the article to be processed from the task list; using the included script, judging the pending whether the article has been included in the default theme; if the pending articles that have not yet included in the default theme, using the included scripts, the pending articles included in the preset theme. The application of the present invention can improve the collection efficiency of the collection script to the article.

【技术实现步骤摘要】
一种文章收录方法及装置
本专利技术涉及网络
,特别是涉及一种文章收录方法及装置。
技术介绍
近年来,互联网信息的快速增长使用户享受到了丰富的精神生活,但同时,由于互联网上的信息量过大,用户无法从海量信息中快速查找到所需信息。为了方便用户查找所需信息,各网站均实现了对文章的收录功能,通常情况下,网站会收录特定题材的文章,比如,股票类的网站会收录与股票有关的文章。在实际应用中,通过执行脚本语言编写的收录脚本,来实现对文章的收录。当待收录文章的数量较多时,可以通过增加收录脚本的数量来解决。使用多个收录脚本对文章进行收录的具体过程为:第一步:使用收录脚本,从预设的数据库中获取符合预设主题的待处理文章;第二步:使用收录脚本,判断获取到的待处理文章是否已经收录在该预设主题中;第三步:若该待处理文章尚未收录在该预设主题中,则使用收录脚本,将该待处理文章收录在该预设主题中。可见,在上述收录过程中,由于使用多个收录脚本同时从预设的数据库中获取待处理文章,可能导致多个收录脚本获取到同一篇文章,进而使多个收录脚本对同一篇文章重新执行上述第二步的判断过程,影响对待处理文章的收录效率。
技术实现思路
本专利技术实施例的目的在于提供一种文章收录方法及装置,以实现提高收录脚本对文章的收录效率。具体技术方案如下:本专利技术实施例提供了一种文章收录方法,方法包括:使用预设的收录脚本,从预设的任务列表中获取待处理文章,任务列表包括至少一篇属于预设主题的待处理文章;在获取待处理文章之后,从任务列表中删除待处理文章;使用收录脚本,判断待处理文章是否已经收录在预设主题中;若为否,使用收录脚本,将待处理文章收录在预设主题中。可选的,在使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,方法还包括:从预设的数据库中获取符合预设主题的待处理文章;根据获取到的待处理文章,生成任务列表。可选的,在使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,方法还包括:判断预设的任务列表中是否包含高优先级任务;若为是,所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤,包括:使用预设的收录脚本,从任务列表中获取高优先级任务对应的待处理文章。可选的,在使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,方法还包括:判断任务列表中是否包含低优先级任务;若为是,使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤,包括:使用预设的收录脚本,从任务列表中获取除低优先级任务以外的其他任务对应的待处理文章。可选的,任务列表还包括关键字;在使用收录脚本,将待处理文章收录在预设主题中的步骤之前,方法还包括:使用收录脚本,判断待处理文章中是否包括关键字;若为是,则执行所述使用所述收录脚本,将所述待处理文章收录在所述预设主题中的步骤。本专利技术实施例还提供了一种文章收录装置,装置包括:第一获取单元,用于使用预设的收录脚本,从预设的任务列表中获取待处理文章,任务列表包括至少一篇属于预设主题的待处理文章;删除单元,用于在获取待处理文章之后,从任务列表中删除待处理文章;第一判断单元,用于使用收录脚本,判断待处理文章是否已经收录在预设主题中;收录单元,用于若所述第一判断单元的判断结果为所述待处理文章尚未收录在所述预设主题中,使用所述收录脚本,将所述待处理文章收录在所述预设主题中。可选的,装置还包括:第二获取单元,用于从预设的数据库中获取符合预设主题的待处理文章;生成单元,用于根据获取到的待处理文章,生成任务列表。可选的,装置还包括:第二判断单元,用于判断预设的任务列表中是否包含高优先级任务;第一获取单元,具体用于若第二判断单元的判断结果为预设的任务列表中包含高优先级任务,使用预设的收录脚本,从任务列表中获取高优先级任务对应的待处理文章。可选的,装置还包括:第三获取单元,用于判断任务列表中是否包含低优先级任务;第一获取单元,具体用于若第三判断单元的判断结果为预设的任务列表中包含低优先级任务,使用预设的收录脚本,从任务列表中获取除低优先级任务以外的其他任务对应的待处理文章。可选的,任务列表还包括关键字;装置还包括:第四判断单元,用于使用收录脚本,判断待处理文章中是否包括关键字;执行单元,用于若第三判断单元的判断结果为待处理文章包括关键字,则执行收录单元。本专利技术实施例又提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述任一所述的文章收录方法。本专利技术实施例另提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的文章收录方法。本专利技术实施例提供的一种文章收录方法及装置,首先,使用预设的收录脚本,从预设的任务列表中获取待处理文章,任务列表包括至少一篇待处理文章;然后,在获取待处理文章之后,从任务列表中删除待处理文章;接下来,使用收录脚本,判断待处理文章是否已经收录在预设主题中;若待处理文章尚未收录在预设主题中,使用收录脚本,将待处理文章收录在预设主题中。这样,在多个收录脚本同时对文章进行收录的场景下,能够避免多个收录脚本同时获取到同一篇文章,进而避免出现多个收录脚本对同一篇文章进行重复判断,提高了收录脚本对文章的收录效率。当然,实施本专利技术的任一产品或方法必不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例的文章收录方法的一种流程图;图2为本专利技术实施例的文章收录方法的又一种流程图;图3为本专利技术实施例的文章收录方法的另一种流程图;图4为本专利技术实施例的文章收录方法的再一种流程图;图5为本专利技术实施例的文章收录装置的结构图;图6为本专利技术实施例的电子设备的示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。近年来,互联网信息的快速增长使用户享受到了丰富的精神生活,但同时,由于互联网上的信息量过大,用户无法从海量信息中快速查找到所需信息。为了方便用户查找所需信息,各网站均实现了对文章的收录功能。通常情况下,网站会收录特定主题的文章,比如,股票类的网站会设定一些与股票有关的主题,比如,近一周涨幅较大的股票等,进而将网站上与该主题相关的文章收录在该主题中,不仅方便用户查看,而且能提高文章的浏览量。在现有技术中,可以通过执行脚本语言编写的收录脚本,来实现对文章的收录。当待收录文章的数量较多时,可以通过增加收录脚本的数量来解决。但是,在上述收录过程中,由于使用多个收录脚本同时从预设的数据库中获取待处理文章,可能导致多个收录脚本获取到同一篇文章,进而使多个收录脚本对同一篇文章重新执行上本文档来自技高网...
一种文章收录方法及装置

【技术保护点】
一种文章收录方法,其特征在于,所述方法包括:使用预设的收录脚本,从预设的任务列表中获取待处理文章,所述任务列表包括至少一篇属于预设主题的待处理文章;在获取所述待处理文章之后,从所述任务列表中删除所述待处理文章;使用所述收录脚本,判断所述待处理文章是否已经收录在所述预设主题中;若为否,使用所述收录脚本,将所述待处理文章收录在所述预设主题中。

【技术特征摘要】
1.一种文章收录方法,其特征在于,所述方法包括:使用预设的收录脚本,从预设的任务列表中获取待处理文章,所述任务列表包括至少一篇属于预设主题的待处理文章;在获取所述待处理文章之后,从所述任务列表中删除所述待处理文章;使用所述收录脚本,判断所述待处理文章是否已经收录在所述预设主题中;若为否,使用所述收录脚本,将所述待处理文章收录在所述预设主题中。2.根据权利要求1所述的方法,其特征在于,在所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,所述方法还包括:从预设的数据库中获取符合预设主题的待处理文章;根据获取到的所述待处理文章,生成任务列表。3.根据权利要求1所述的方法,其特征在于,在所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,所述方法还包括:判断预设的任务列表中是否包含高优先级任务;若为是,所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤,包括:使用预设的收录脚本,从所述任务列表中获取所述高优先级任务对应的待处理文章。4.根据权利要求1所述的方法,其特征在于,在所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,所述方法还包括:判断所述任务列表中是否包含低优先级任务;若为是,所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤,包括:使用预设的收录脚本,从所述任务列表中获取除所述低优先级任务以外的其他任务对应的待处理文章。5.根据权利要求1所述的方法,其特征在于,所述任务列表还包括关键字;在所述使用所述收录脚本,将所述待处理文章收录在所述预设主题中的步骤之前,所述方法还包括:使用所述收录脚本,判断所述待处理文章中是否包括所述关键字;若为是,则执行所述使用所述收录脚本,将所述待处理文章收录在所述预...

【专利技术属性】
技术研发人员:沈文策
申请(专利权)人:福建中金在线信息科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1