【技术实现步骤摘要】
本专利技术涉及一种网络信息监控分析系统,属于网络信息化领域。
技术介绍
自互联网诞生以来,Internet已经发展成为拥有近亿用户和数亿页面的巨大的全球化信息仓库,而且其信息容量仍在以指数形式飞速地增长。从互联网中获取信息已成为个人获取知识的主要方法和重要手段,也成为当前企业获取情报的重要途径,但是,面对浩如烟海的网络信息,传统的人工搜集和处理等方法都已难以胜任。为此,国内外在信息搜索领域做了大量研究,并开发了多种搜索引擎,如Baidu、Google,Yahoo,Lycos等。从某种程度上这些搜索引擎提高了搜索的效率和速度,但仍然存 在着很大的局限性,最突出表现在以下几个方面首先,由于采用的是全文检索或关键词检索的方式,基于字面的检索机制造成实际检索结果与用户需求之间的偏差,即检索返回“有用”信息太少,“垃圾”信息太多,称之为Rich Data Poor Information的问题;其次,网络搜索引擎需面对广泛的知识领域,而针对某一特殊领域因没有足够的背景知识,导致搜索到大量无关的网页,具有较大相关性的网页却很少;最后,检索的速度和效率太低,并且不能保证信息的 ...
【技术保护点】
一种网络信息监控分析系统,属于网络信息化领域,其特征在于,网络信息监控分析系统:1)该系统成功的解决了针对特定领域信息收集的难题,实现了智能化的信息搜集,成功地为企业竞争情报的收集提供服务。2)提高了网络信息资源的集中度,有利于监控人员同时监控数个网站,解决了传统网站监控方法存在的人力资源消耗的问题。3)在抓取算法实现中采用了非递归多线程方式的抓取算法,较大地提高了抓取的效率,改进了网页收集子系统性能;并在此基础上增加了利用锚文本等方法过滤URL,有效地提高了网页采集的准确率和信息的有效性。4)在网络信息收集子系统中,提出了并行结构新概念,并在并行结构的基础上建立了交换模式 ...
【技术特征摘要】
1. 一种网络信息监控分析系统,属于网络信息化领域,其特征在于,网络信息监控分析系统 1)该系统成功的解决了针对特定领域信息收集的难题,实现了智能化的信息搜集,成功地为企业竞争情报的收集提供服务。2)提高了网络信息资源的集中度,有利于监控人员同时监控数个网站,解决了传统网站监控方法存在的人力资源消耗的问题。3)在抓取算法实现中采用了非递归多线程方式的抓取算法,较大地提高了抓取的效率,改进了网页收集子系统性...
【专利技术属性】
技术研发人员:庞兵,
申请(专利权)人:张家港凯纳信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。