事件获取的方法及装置制造方法及图纸

技术编号:8594080 阅读:177 留言:0更新日期:2013-04-18 07:17
本发明专利技术公开了一种事件获取的方法及装置,涉及互联网技术领域,实现了在指定数据源以及指定数据源的指定区域获取事件信息,提高了事件获取效率。本发明专利技术包括:通过网页结构信息获取指定的数据源以及指定数据源的指定区域,在指定的数据源以及数据源的指定区域中按照预先设置的事件的获取周期查找预先设置的事件关键词,并获取包含事件关键词的事件信息。本发明专利技术实施例主要应用于事件获取流程中。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种事件获取的方法及装置
技术介绍
目前,采用的事件获取方法是录入员通过网络浏览器,访问多个事件数据源网站,在网页上查找事件信息,该事件信息包括事件的文字内容和对应的图片,然后录入到事件信息系统中。还要将事件信息重复保存到Excel表格中,用于存档,耗费人力。现有技术采用多次完成对所有数据源的数据获取,当获取某一数据源的效率下降到某一阈值时,停止当前数据源的数据获取,并开始获取下一个数据源的数据,依次类推直到把所有待集成数据源都获取一遍;然后再重复上述过程,直到所有待集成数据源都已达到结束条件。在实现上述现有技术方案的过程中,专利技术人发现现有技术中存在如下问题现有技术获取到大量无用信息,事件获取效率很低。
技术实现思路
本专利技术的实施例提供一种事件获取的方法及装置,实现了在指定数据源以及指定数据源的指定区域获取事件信息,提高了事件获取效率。为达到上述目的,本专利技术的实施例采用如下技术方案一种事件获取的方法,包括获取指定数据源以及所述指定数据源的指定区域;根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述指定数据源的指定区域中获取事件信息。一种事件获取的装置,包括获取单元,用于获取指定数据源以及所述指定数据源的指定区域;所述获取单元,还用于根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述指定数据源的指定区域中获取事件信息。本专利技术实施例提供的事件获取的方法及装置,通过网页结构信息获取指定的数据源以及指定数据源的指定区域,在指定的数据源以及数据源的指定区域中按照预先设置的事件的获取周期查找预先设置的事件关键词,并获取包含事件关键词的事件信息。现有技术在获取事件信息时,获取了大量无用信息。而本专利技术的技术方案,实现了在指定数据源以及指定数据源的指定区域获取事件信息,提高了事件获取效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例中提供的一种事件获取方法的流程图;图2为本专利技术另一实施例中提供的一种事件获取方法的流程图;图3为本专利技术另一实施例中提供的一种事件获取装置的组成框图;图4为本专利技术另一实施例中提供的一种事件获取装置的组成框图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术一实施例提供了一种事件获取的方法,如图1所示,该方法包括101、获取指定数据源以及该指定数据源的指定区域。其中,指定数据源包括但不限定为网页,指定数据源的指定区域包括一个或若干个链接,通过该链接可获取事件信息。可选的,上述的事件信息优选为交通事件信息。可选的,在执行本步骤之前,确定当前网页结构信息,并根据该网页结构信息获取指定数据源以及所述指定数据源的指定区域。值得说明的是,此处网页结构信息,指示所要获取的事件在该网页中的位置,即数据源所在位置。网页结构信息还指示,能够概述所要获取的事件的重要信息出现的位置,该重要信息出现的位置包括标题、首段等,此处事件的重要信息出现的位置即指定数据源的制定区域。例如,在网页中包括娱乐、时政、天气等事件,所要获取事件为交通事件,而交通事件在该网页中一般出现在时政框的第一栏中,且在交通事件中重要信息一般出现在标题,则时政框的第一栏为指定数据源,该指定数据源的标题为指定数据源的指定区域。此示例只是获取指定数据源以及指定数据源的指定区域的一种实现方法,本专利技术实施例对此不进行限制。进一步的,对于不同的网页其网页结构是不同的,也就是说,数据源以及数据源的指定区域在不同网页中的位置是不同的。若当前的网页结构发生变化时,需重新根据网页结构信息获取指定数据源以及指定数据源的指定区域。102、根据预先设置的事件的获取周期以及事件关键词,在指定数据源以及指定数据源的指定区域中获取事件信息。值得说明的是,由于不同交通事件的发生的概率、频率不同,本步骤中的设置事件的获取周期,即为每个事件设置周期。事件关键词为事件特征的概述。例如,交通事件的关键词包括施工、限行、追尾等。施工类事件的获取周期可设置为5天,限行的获取周期可设置为2天,追尾的获取周期可设置为I小时。此处,只是设置事件的获取周期以及事件关键词的一种实现方法,本专利技术实施例对此不进行限制。此外,本步骤中提到的事件信息包括事件的文字描述或图片。可选的,本步骤的具体实现方式包括根据设置的事件关键词,判断指定数据源的指定区域中是否包含任意一个或多个事件关键词;当确定指定数据源的指定区域中的事件信息中包含至少一个事件关键词时,获取并保存该事件信息。进一步的,获取当前所述指定数据源的指定区域的事件信息,并与存储的所述指定区域中的事件信息进行比对,比对结果的描述如下当获取的当前指定数据源的指定区域中的事件信息与存储的指定数据源的指定区域中的事件信息不同时,确定该当前指定数据源的指定区域中的事件信息为新的事件信息,并存储所述新的事件信息。当获取的当前指定数据源的指定区域中的事件信息中不能包括存储的所述指定数据源的指定区域中的全部事件信息时,在所述当前指定数据源的指定区域中获取不到,且已存储的所述指定数据源的指定区域中的事件信息上添加标识。其中,此处提到的标识包括但不限定为删除标记。值得说明的是,此处获取的当前所述指定数据源的指定区域的事件信息,与存储的指定数据源的指定区域中的事件信息,包括在同一数据源的同一指定区域中,不同事件的获取周期获取的事件信息。如果当前周期获取的事件信息与之前周期获取的事件信息相同时,则确定当前事件信息不是新的事件,不进行存储;如果确定当前周期获取的事件信息与之前周期获取的事件信息不同时,则确定当前周期获取的事件信息为新的事件信息,并存储该新的事件信息;如果存储的之前周期获取的事件信息中,在当前周期获取的事件信息中不存在时,确定之前周期获取的事件信息在网页的该指定区域中被删除,则在存储的之前周期获取的事件信息中添加删除标记。其中,删除标记用于指示用户之前周期获取的事件信息在之前获取该事件信息的指定数据源的指定区域中已经被删除。例如,在指定数据源的指定区域中按照周期获取事件信息时,在第一周期获取到4个事件信息分别为A、B、C、D,并将这四个事件信息进行存储,但在第二周期中获取到三个事件信息分别为A、B、D,此时与第一周期获取的事件信息相比缺少了 C,则在已存储的事件信息C上添加删除标记。 进一步的,在执彳丁完步骤102之后,还包括第一步确定存储的事件信息的文字描述与图片的对应关系,并存储该事件信息的文字描述、图片以及事件信息的文字描述与图片的对应关系。可选的,为加快运行以及查找速率,创建第一数据库,用于存储事件信息的文字描述,在硬盘中创建指定目录存储事件信息的图片。在该第一数据库中,按照存储事件信息的时间,依次为事件信息进行本文档来自技高网...

【技术保护点】
一种事件获取的方法,其特征在于,包括:获取指定数据源以及所述指定数据源的指定区域;根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述指定数据源的指定区域中获取事件信息。

【技术特征摘要】
1.一种事件获取的方法,其特征在于,包括 获取指定数据源以及所述指定数据源的指定区域; 根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述指定数据源的指定区域中获取事件信息。2.根据权利要求1所述的方法,其特征在于,在所述获取指定数据源以及所述指定数据源的指定区域之前,包括 确定当前网页结构信息,并根据所述网页结构信息获取所述指定数据源以及所述指定数据源的指定区域。3.根据权利要求1所述的方法,其特征在于,所述根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述指定数据源的指定区域中获取事件信息,包括 根据所述事件关键词,判断所述指定数据源的指定区域中是否包含任意一个或多个所述事件关键词; 当确定所述指定数据源的指定区域中包含至少一个所述事件关键词时,获取并保存所述指定区域中的事件信息。4.根据权利要求3所述的方法,其特征在于,在所述获取并保存所述指定区域中的事件信息之后,还包括 获取当前指定数据源的指定区域中的事件信息,并与存储的所述指定数据源的指定区域中的事件信息进行比对; 若获取的当前指定数据源的指定区域中的事件信息与存储的所述指定数据源的指定区域中的事件信息不同时,确定所述当前指定数据源的指定区域中的事件信息为新的事件信息,并存储所述新的事件信息; 若获取的当前指定数据源的指定区域中的事件信息中不能包括存储的所述指定数据源的指定区域中的全部事件信息时,在所述当前指定数据源的指定区域中获取不到,且已存储的所述指定数据源的指定区域中的事件信息上添加标识。5.根据权利要求1-4任意一项所述的方法,其特征在于,还包括 确定存储的所述事件信息的文字描述与图片的对应关系,并存储所述事件信息的文字描述、图片以及事件信息的文字描述与图片的对应关系; 根据预设提取规则获取所述事件信息的文字描述,并根据所述事件信息的文字描述与图片的对应关系,查看所述事件信息的图片; 将所述根据预设提取规则获取所述事件信息的文字描述进行存储。6.一种事件获取的装置,其特征在于,包括 获取单元,用于获取指定数据源以及所述指定数据源的指定区域; 所述获取单元,还用于根据预先设置的事件的获取周期以及事件...

【专利技术属性】
技术研发人员:王晓瑄李建军
申请(专利权)人:北京世纪高通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1