一种网络信息收集方法技术

技术编号:8594041 阅读:354 留言:0更新日期:2013-04-18 07:14
本发明专利技术涉及信息处理技术领域,尤其是一种自动化的网络信息收集方法。本发明专利技术通过查询条件格式并设置配置文件,然后利用配置文件读取所定义的查询条件,根据查询条件对指定网址的信息进行获取、过滤,并将结果返回给查询者。本发明专利技术可以方便用户在庞大的网络中获取到用户感兴趣的数据,节省用户大量的搜索时间。可以用户网络信息的收集中。

【技术实现步骤摘要】

本专利技术涉及信息处理
,尤其是一种自动化的网络信息收集方法
技术介绍
在我们日常的生活与工作中,经常会对其中一些数据特别感兴趣,特别是对于一些特别好的网站,希望关注这些网站的这部份数据。如,有一些同事特别喜欢在新浪网和腾讯网上浏览美国职业男子篮球赛中关于热火队的比赛消息;这时,该同事只有通过浏览器打开该网址,然后在网页中搜索、点击其中几个出名的网站,找到该网站中关于美国职业男子篮球赛的新闻,最后找到其中的热火队比赛结果。类似的查询还有很多,如某一个同事关注关中村的服务器信息、关注京东网上某一硬件设备的价格变动或配置变动等。诸如此类的信息,都需要用户通过网址慢慢的搜索才可以得到相应的信息,某些情况下还找不到合适的信息,浪费大量的时间。
技术实现思路
本专利技术解决的技术问题在于提供自动化的网络信息收集方法,实现对用户感兴趣信息的自动收集、反馈。本专利技术解决前述技术问题的技术方案是按照以下步骤进行步骤I,定义查询条件格式并设置配置文件;步骤2,读取配置文件,获取查询的信息科目;步骤3,通过配置文件,获取查询的提取文件;步骤4,通过配置文件,获得信息来源的网址;步骤5,通过网址,读取该网址的信息;步骤6,以提取文件为过滤条件,对网址信息进行过滤;剩余符合提取文件的信息;步骤7,将过滤后的信息发送给查询者指定的地址。所述的查询条件格式定义为以键值对的形式出现,多个条件以“;”隔开。配置文件可以读取所定义的查询条件,根据查询条件对指定网址的信息进行获取、过滤,并将结果返回给查询者。所述的过滤后的信息通过电子邮件方式反馈给查询者。本专利技术通过配置文件,可以到指定的网站获取用户感兴趣的信息,最终汇总并通过邮件的方式发送到指定的邮件中;同时本方法可设置信息采集周期,使用户可以及时的跟踪信息的变化。本专利技术在一定程度上改变了信息收集方式,大大提高了工作效率,避免每天做重复的工作。附图说明下面结合附图对本专利技术进一步说明图1为本专利技术网络信息收集的流程图;图2为本专利技术配置文件定义结构示意图。具体实施例方式本专利技术网络信息自动化收集可按如下步骤进行 步骤I,定义查询条件格式并设置配置文件;步骤2,读取配置文件,获取查询的信息科目;步骤3,通过配置文件,获取查询的提取文件;步骤4,通过配置文件,获得信息来源的网址;步骤5,通过网址,读取该网址的信息;步骤6,以提取文件为过滤条件,对网址信息进行过滤;剩余符合提取文件的信息;步骤7,将过滤后的信息通过电子邮件等发送给查询者指定的地址。所述的查询条件格式定义为以键值对的形式出现,多个条件以“;”隔开。前述的配置文件可以读取所定义的查询条件,根据查询条件对指定网址的信息进行获取、过滤,并将结果返回给查询者。下面具体以在两个体育网站中获取火箭队2012年12月19号的比分为例。如附图1所示,包括如下步骤第I步、先要全体宣传,约定自动回复邮件查询信息装置的邮件格式。在此约定,自动化网络信息收集装置只对查询条件有格式约定,格式约定为以键值对的形式出现,多个条件以“;”隔开。具体格式为查询条件1=查询条件值;查询条件2=查询条件值,其中,参数个数可不断扩展。比如,查询火箭队2012年12月19号的比分,则此查询条件为“球队=火箭;比赛日期=2012-12-19” ;其科目为比分。具体见图2所示结构。第2步、读取配置文件F,获取其实需要获取的科目信息S,信息过滤条件C与数据来源网址As ;第3步、通过网址As,读取该网址中的数据Info ;第4步、通过科目S,获取Info中关于该科目的信息S_Info ;第5步、通过过滤条件C,过滤S_Info的数据,最终得到满足用户需求的信息N_Info ;第6步、装置通过邮件方式,把查询的记录信息返回装置使用者。本文档来自技高网...

【技术保护点】
一种网络信息收集方法,其特征在于:按照以下步骤进行:步骤1,定义查询条件格式并设置配置文件;步骤2,读取配置文件,获取查询的信息科目;步骤3,通过配置文件,获取查询的提取文件;步骤4,通过配置文件,获得信息来源的网址;步骤5,通过网址,读取该网址的信息;步骤6,以提取文件为过滤条件,对网址信息进行过滤;剩余符合提取文件的信息;步骤7,将过滤后的信息发送给查询者指定的地址。

【技术特征摘要】
1.一种网络信息收集方法,其特征在于按照以下步骤进行步骤I,定义查询条件格式并设置配置文件;步骤2,读取配置文件,获取查询的信息科目;步骤3,通过配置文件,获取查询的提取文件;步骤4,通过配置文件,获得信息来源的网址;步骤5,通过网址,读取该网址的信息;步骤6,以提取文件为过滤条件,对网址信息进行过滤;剩余符合提取文件的信息; 步骤7,将过滤后的信息发送给查询者指定的地址。2.根据权利要求1所述的网络信息收集方法,其特征在...

【专利技术属性】
技术研发人员:关班记孙傲冰季统凯
申请(专利权)人:国云科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1