网络信息监控分析系统技术方案

技术编号:8131085 阅读:203 留言:0更新日期:2012-12-27 03:16
本发明专利技术涉及一种网络信息监控分析系统,属于网络信息化领域。本发明专利技术根据现今应用最广泛的HTML网页信息的特点,在对现有信息搜集、预处理和自动分类等网络信息处理技术进行深入的分析与研究的基础上,针对目前信息搜集技术的不足,设计开发了一个基于信息领域的网络信息监控分析系统,实现了通过互联网实时定向地自动捕捉多个门户网站以及专门网站关于专业领域的“有用”信息的功能。工作流程为:(1)由“网络信息收集子系统”采集URL、锚文本、网页,并对采集回的网页进行清洗;(2)“智能分析预归类子系统”将系统中的网页进行分类,并根据阀值过滤无用信息;(3)“自动汇总检索子系统”完成站内检索、自动生成报表功能。

【技术实现步骤摘要】

本专利技术涉及一种网络信息监控分析系统,属于网络信息化领域。
技术介绍
自互联网诞生以来,Internet已经发展成为拥有近亿用户和数亿页面的巨大的全球化信息仓库,而且其信息容量仍在以指数形式飞速地增长。从互联网中获取信息已成为个人获取知识的主要方法和重要手段,也成为当前企业获取情报的重要途径,但是,面对浩如烟海的网络信息,传统的人工搜集和处理等方法都已难以胜任。为此,国内外在信息搜索领域做了大量研究,并开发了多种搜索引擎,如Baidu、Google,Yahoo,Lycos等。从某种程度上这些搜索引擎提高了搜索的效率和速度,但仍然存 在着很大的局限性,最突出表现在以下几个方面首先,由于采用的是全文检索或关键词检索的方式,基于字面的检索机制造成实际检索结果与用户需求之间的偏差,即检索返回“有用”信息太少,“垃圾”信息太多,称之为Rich Data Poor Information的问题;其次,网络搜索引擎需面对广泛的知识领域,而针对某一特殊领域因没有足够的背景知识,导致搜索到大量无关的网页,具有较大相关性的网页却很少;最后,检索的速度和效率太低,并且不能保证信息的时效性和权威性,以上本文档来自技高网...

【技术保护点】
一种网络信息监控分析系统,属于网络信息化领域,其特征在于,网络信息监控分析系统:1)该系统成功的解决了针对特定领域信息收集的难题,实现了智能化的信息搜集,成功地为企业竞争情报的收集提供服务。2)提高了网络信息资源的集中度,有利于监控人员同时监控数个网站,解决了传统网站监控方法存在的人力资源消耗的问题。3)在抓取算法实现中采用了非递归多线程方式的抓取算法,较大地提高了抓取的效率,改进了网页收集子系统性能;并在此基础上增加了利用锚文本等方法过滤URL,有效地提高了网页采集的准确率和信息的有效性。4)在网络信息收集子系统中,提出了并行结构新概念,并在并行结构的基础上建立了交换模式,有效地提高了信息采...

【技术特征摘要】
1. 一种网络信息监控分析系统,属于网络信息化领域,其特征在于,网络信息监控分析系统 1)该系统成功的解决了针对特定领域信息收集的难题,实现了智能化的信息搜集,成功地为企业竞争情报的收集提供服务。2)提高了网络信息资源的集中度,有利于监控人员同时监控数个网站,解决了传统网站监控方法存在的人力资源消耗的问题。3)在抓取算法实现中采用了非递归多线程方式的抓取算法,较大地提高了抓取的效率,改进了网页收集子系统性...

【专利技术属性】
技术研发人员:庞兵
申请(专利权)人:张家港凯纳信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1