The embodiment of the invention provides a method and a device included in this article, the method includes: the default script included, to get the treatment from the perspective of the task list, the list of tasks including at least one belonging to the default theme to be processed after obtaining the articles; to be processed articles, to delete the article to be processed from the task list; using the included script, judging the pending whether the article has been included in the default theme; if the pending articles that have not yet included in the default theme, using the included scripts, the pending articles included in the preset theme. The application of the present invention can improve the collection efficiency of the collection script to the article.
【技术实现步骤摘要】
一种文章收录方法及装置
本专利技术涉及网络
,特别是涉及一种文章收录方法及装置。
技术介绍
近年来,互联网信息的快速增长使用户享受到了丰富的精神生活,但同时,由于互联网上的信息量过大,用户无法从海量信息中快速查找到所需信息。为了方便用户查找所需信息,各网站均实现了对文章的收录功能,通常情况下,网站会收录特定题材的文章,比如,股票类的网站会收录与股票有关的文章。在实际应用中,通过执行脚本语言编写的收录脚本,来实现对文章的收录。当待收录文章的数量较多时,可以通过增加收录脚本的数量来解决。使用多个收录脚本对文章进行收录的具体过程为:第一步:使用收录脚本,从预设的数据库中获取符合预设主题的待处理文章;第二步:使用收录脚本,判断获取到的待处理文章是否已经收录在该预设主题中;第三步:若该待处理文章尚未收录在该预设主题中,则使用收录脚本,将该待处理文章收录在该预设主题中。可见,在上述收录过程中,由于使用多个收录脚本同时从预设的数据库中获取待处理文章,可能导致多个收录脚本获取到同一篇文章,进而使多个收录脚本对同一篇文章重新执行上述第二步的判断过程,影响对待处理文章的收录效率。
技术实现思路
本专利技术实施例的目的在于提供一种文章收录方法及装置,以实现提高收录脚本对文章的收录效率。具体技术方案如下:本专利技术实施例提供了一种文章收录方法,方法包括:使用预设的收录脚本,从预设的任务列表中获取待处理文章,任务列表包括至少一篇属于预设主题的待处理文章;在获取待处理文章之后,从任务列表中删除待处理文章;使用收录脚本,判断待处理文章是否已经收录在预设主题中;若为否,使用收录脚本,将 ...
【技术保护点】
一种文章收录方法,其特征在于,所述方法包括:使用预设的收录脚本,从预设的任务列表中获取待处理文章,所述任务列表包括至少一篇属于预设主题的待处理文章;在获取所述待处理文章之后,从所述任务列表中删除所述待处理文章;使用所述收录脚本,判断所述待处理文章是否已经收录在所述预设主题中;若为否,使用所述收录脚本,将所述待处理文章收录在所述预设主题中。
【技术特征摘要】
1.一种文章收录方法,其特征在于,所述方法包括:使用预设的收录脚本,从预设的任务列表中获取待处理文章,所述任务列表包括至少一篇属于预设主题的待处理文章;在获取所述待处理文章之后,从所述任务列表中删除所述待处理文章;使用所述收录脚本,判断所述待处理文章是否已经收录在所述预设主题中;若为否,使用所述收录脚本,将所述待处理文章收录在所述预设主题中。2.根据权利要求1所述的方法,其特征在于,在所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,所述方法还包括:从预设的数据库中获取符合预设主题的待处理文章;根据获取到的所述待处理文章,生成任务列表。3.根据权利要求1所述的方法,其特征在于,在所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,所述方法还包括:判断预设的任务列表中是否包含高优先级任务;若为是,所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤,包括:使用预设的收录脚本,从所述任务列表中获取所述高优先级任务对应的待处理文章。4.根据权利要求1所述的方法,其特征在于,在所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤之前,所述方法还包括:判断所述任务列表中是否包含低优先级任务;若为是,所述使用预设的收录脚本,从预设的任务列表中获取待处理文章的步骤,包括:使用预设的收录脚本,从所述任务列表中获取除所述低优先级任务以外的其他任务对应的待处理文章。5.根据权利要求1所述的方法,其特征在于,所述任务列表还包括关键字;在所述使用所述收录脚本,将所述待处理文章收录在所述预设主题中的步骤之前,所述方法还包括:使用所述收录脚本,判断所述待处理文章中是否包括所述关键字;若为是,则执行所述使用所述收录脚本,将所述待处理文章收录在所述预...
【专利技术属性】
技术研发人员:沈文策,
申请(专利权)人:福建中金在线信息科技有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。