【技术实现步骤摘要】
本专利技术涉及互联网
,尤其涉及一种事件获取的方法及装置。
技术介绍
目前,采用的事件获取方法是录入员通过网络浏览器,访问多个事件数据源网站,在网页上查找事件信息,该事件信息包括事件的文字内容和对应的图片,然后录入到事件信息系统中。还要将事件信息重复保存到Excel表格中,用于存档,耗费人力。现有技术采用多次完成对所有数据源的数据获取,当获取某一数据源的效率下降到某一阈值时,停止当前数据源的数据获取,并开始获取下一个数据源的数据,依次类推直到把所有待集成数据源都获取一遍;然后再重复上述过程,直到所有待集成数据源都已达到结束条件。在实现上述现有技术方案的过程中,专利技术人发现现有技术中存在如下问题现有技术获取到大量无用信息,事件获取效率很低。
技术实现思路
本专利技术的实施例提供一种事件获取的方法及装置,实现了在指定数据源以及指定数据源的指定区域获取事件信息,提高了事件获取效率。为达到上述目的,本专利技术的实施例采用如下技术方案一种事件获取的方法,包括获取指定数据源以及所述指定数据源的指定区域;根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述 ...
【技术保护点】
一种事件获取的方法,其特征在于,包括:获取指定数据源以及所述指定数据源的指定区域;根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述指定数据源的指定区域中获取事件信息。
【技术特征摘要】
1.一种事件获取的方法,其特征在于,包括 获取指定数据源以及所述指定数据源的指定区域; 根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述指定数据源的指定区域中获取事件信息。2.根据权利要求1所述的方法,其特征在于,在所述获取指定数据源以及所述指定数据源的指定区域之前,包括 确定当前网页结构信息,并根据所述网页结构信息获取所述指定数据源以及所述指定数据源的指定区域。3.根据权利要求1所述的方法,其特征在于,所述根据预先设置的事件的获取周期以及事件关键词,在所述指定数据源以及所述指定数据源的指定区域中获取事件信息,包括 根据所述事件关键词,判断所述指定数据源的指定区域中是否包含任意一个或多个所述事件关键词; 当确定所述指定数据源的指定区域中包含至少一个所述事件关键词时,获取并保存所述指定区域中的事件信息。4.根据权利要求3所述的方法,其特征在于,在所述获取并保存所述指定区域中的事件信息之后,还包括 获取当前指定数据源的指定区域中的事件信息,并与存储的所述指定数据源的指定区域中的事件信息进行比对; 若获取的当前指定数据源的指定区域中的事件信息与存储的所述指定数据源的指定区域中的事件信息不同时,确定所述当前指定数据源的指定区域中的事件信息为新的事件信息,并存储所述新的事件信息; 若获取的当前指定数据源的指定区域中的事件信息中不能包括存储的所述指定数据源的指定区域中的全部事件信息时,在所述当前指定数据源的指定区域中获取不到,且已存储的所述指定数据源的指定区域中的事件信息上添加标识。5.根据权利要求1-4任意一项所述的方法,其特征在于,还包括 确定存储的所述事件信息的文字描述与图片的对应关系,并存储所述事件信息的文字描述、图片以及事件信息的文字描述与图片的对应关系; 根据预设提取规则获取所述事件信息的文字描述,并根据所述事件信息的文字描述与图片的对应关系,查看所述事件信息的图片; 将所述根据预设提取规则获取所述事件信息的文字描述进行存储。6.一种事件获取的装置,其特征在于,包括 获取单元,用于获取指定数据源以及所述指定数据源的指定区域; 所述获取单元,还用于根据预先设置的事件的获取周期以及事件...
【专利技术属性】
技术研发人员:王晓瑄,李建军,
申请(专利权)人:北京世纪高通科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。