搜索引擎链接分析系统及分析方法技术方案

技术编号:19425009 阅读:24 留言:0更新日期:2018-11-14 10:35
本发明专利技术揭示了一种搜索引擎链接分析系统及分析方法,系统包括互联网云平台单元、信息抓取单元、信息存储单元、信息运算处理单元以及客户端反馈单元;方法包括互联网云平台步骤、信息抓取步骤、信息存储步骤元、信息运算处理步骤以及客户端反馈步骤。本发明专利技术通过对搜索信息源的确认,判断搜索结果来源的可靠性,并以此作为依据,对搜索结果分析过程中的权重重新分配,从而提升了搜索结果的准确性与可靠性。同时,本发明专利技术能够实时监测各类网站中的关键词排名,降低了各类突发、异常情况对搜索结果的影响,避免了人为恶意链接带给网络搜索引擎的不利影响。

【技术实现步骤摘要】
搜索引擎链接分析系统及分析方法
本专利技术涉及一种分析系统及分析方法,具体涉及一种搜索引擎链接分析系统及分析方法,属于互联网搜索领域。
技术介绍
随着互联网的普及、网络搜索引擎的不断发展,人们在查阅各类信息时,越来越倾向于选择使用搜索引擎,网络搜索引擎在人们日常生活中的使用率和普及率也越来越高。也正是由于这样的发展趋势,网络搜索引擎的排名系统也应运而生。一般而言,网络搜索引擎的排名系统可以根据关键词的搜索量、网站内关键词的点击量等信息,自动结算出搜索结果的排名,并以从高到低的形式呈现给使用者。但是在实际的应用过程中,技术人员发现,目前现有的搜索引擎排名系统很容易受到网络内各类非法网站、非正规论坛等方面的恶意影响,尤其体现在博客群、论坛群发以及站群等几个方面。对站群和博客群而言,可以通过复制链接等方式在短时间内复制出大量的关键词,而对于论坛群发而言,也可以通过给目标关键词投票的方式为关键词制造大量的点击量。上述的这两种做法都会对搜索引擎的排名系统产生恶意影响,导致搜索结果的准确性与可靠性大大降低。综上所述,如何提供一种搜索引擎链接分析系统及分析方法,以提高网络搜索引擎搜索结果的准确性,就成为了本领域内技术人员所亟待解决的问题。
技术实现思路
鉴于现有技术存在上述缺陷,本专利技术的目的是提出一种搜索引擎链接分析系统及分析方法。本专利技术的目的,将通过以下技术方案得以实现:一种搜索引擎链接分析系统,包括:互联网云平台单元,用于与万维网建立数据连接,获取万维网中的数据信息;信息抓取单元,用于依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发;信息存储单元,用于接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份;信息运算处理单元,用于接收用户的操作请求,并依据操作请求在信息存储单元内获取数据信息,并进行运算处理;客户端反馈单元,用于键入用户的操作请求,并将信息运算处理单元的处理结果反馈给用户。优选地,所述信息抓取单元包括:爬虫服务器,用于在万维网中抓取数据信息;网站服务器,用于接收用户的操作请求,依据操作控制爬虫服务器完成数据信息抓取,并将抓取到的数据信息转载下发。优选地,所述信息运算处理单元包括:网段查询模块,用于查询网站IP所属的网段;域名查询模块,用于查询域名IP以及域名所有者信息;阈值设定模块,用于设置反链数上升速度阈值、外链增长速度阈值,相同链接数量阈值以及相互链接数量阈值,作为判断处理依据;反链数上升速度判断模块,用于检测网站反链数的上升速度并进行比对,当检测网站反链数上升速度超过反链数上升速度阈值时,对网站进行降权处理或重点监测处理;外链增长速度判断模块,用于检测网站外链的增长速度并进行比对,当检测网站外链增长速度超过外链增长速度阈值时,对网站的外链进行降权操作;初次内容比对模块,用于对比锚文件与链接页面内容,当锚文件与链接页面内容无关时,对外链进行降权操作;二次内容比对模块,用于对比网站反链页面和链接页面内容,当网站反链页面和链接页面内容无关时,对外链进行降权操作;网站外链分析模块,用于检测比对网站外链内容,获取网站内存在的链接相同的反链数量,当链接相同的反链数量大于相同链接数量阈值时,对网站或外链进行降权操作;网站内链分析模块,用于检测比对网站url链接内容,获取url链接相似网站间相互链接的数量,当相互链接的数量大于相互链接数量阈值时,对网站或外链进行降权操作。优选地,所述锚文本为链接所在的上下文信息。优选地,所述客户端反馈单元包括App客户端或Web客户端。一种搜索引擎链接分析方法,包括:S1、互联网云平台步骤,与万维网建立数据连接,获取万维网中的数据信息;S2、信息抓取步骤,依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发;S3、信息存储步骤,接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份;S4、信息运算处理步骤,接收用户的操作请求,并依据操作请求在信息存储单元内获取数据信息,并进行运算处理;S5、客户端反馈步骤,键入用户的操作请求,并将信息运算处理单元的处理结果反馈给用户。优选地,所述信息抓取步骤包括:S21、爬虫服务器设置子步骤,设置爬虫服务器,在万维网中抓取数据信息;S22、网站服务器设置子步骤,设置网站服务器,接收用户的操作请求,依据操作控制爬虫服务器完成数据信息抓取,并将抓取到的数据信息转载下发。优选地,所述信息运算处理步骤包括:S41、网段查询子步骤,查询网站IP所属的网段;S42、域名查询子步骤,查询域名IP以及域名所有者信息;S43、阈值设定子步骤,设置反链数上升速度阈值、外链增长速度阈值,相同链接数量阈值以及相互链接数量阈值,作为判断处理依据;S44、反链数上升速度判断子步骤,检测网站反链数的上升速度并进行比对,当检测网站反链数上升速度超过反链数上升速度阈值时,对网站进行降权处理或重点监测处理;S45、外链增长速度判断子步骤,检测网站外链的增长速度并进行比对,当检测网站外链增长速度超过外链增长速度阈值时,对网站的外链进行降权操作;S46、初次内容比对子步骤,对比锚文件与链接页面内容,当锚文件与链接页面内容无关时,对外链进行降权操作;S47、二次内容比对子步骤,对比网站反链页面和链接页面内容,当网站反链页面和链接页面内容无关时,对外链进行降权操作;S48、网站外链分析子步骤,检测比对网站外链内容,获取网站内存在的链接相同的反链数量,当链接相同的反链数量大于相同链接数量阈值时,对网站或外链进行降权操作;S49、网站内链分析子步骤,检测比对网站url链接内容,获取url链接相似网站间相互链接的数量,当相互链接的数量大于相互链接数量阈值时,对网站或外链进行降权操作。优选地,所述锚文本为链接所在的上下文信息。优选地,所述客户端反馈步骤包括设置App客户端或Web客户端。与现有技术上相比,本专利技术的突出效果如下:本专利技术通过对搜索信息源的多次确认,判断搜索结果来源的可靠性,并以此作为依据,对搜索结果分析过程中的权重重新分配,从而提升了搜索结果的准确性与可靠性。同时,本专利技术能够实时监测各类网站中的关键词排名,降低了各类突发、异常情况对搜索结果的影响,避免了人为恶意链接带给网络搜索引擎的不利影响。此外,本专利技术的分析系统和分析方法还可以应用于各类相近功能的系统中,为各类基于互联网大数据的运算处理系统提供可靠的信息来源,适用性和通用性强。综上所述,本专利技术提供了行之有效的链接分析系统及分析方法,使用效果良好且兼容性强,具有很高的使用及推广价值。以下便结合实施例附图,对本专利技术的具体实施方式作进一步的详述,以使本专利技术技术方案更易于理解、掌握。附图说明图1是本专利技术中分析系统的结构框图。具体实施方式如图所示,本专利技术揭示了一种搜索引擎链接分析系统及分析方法。具体而言,一种搜索引擎链接分析系统,包括:互联网云平台单元,用于与万维网建立数据连接,获取万维网中的数据信息。信息抓取单元,用于依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发。信息存储单元,用于接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份。在本实施例中,所述信息存储单元为Elasticsearch数据库。信息运算处理单元,用于接收用户的操作请求,并依据操作请求在本文档来自技高网...

【技术保护点】
1.一种搜索引擎链接分析系统,包括:互联网云平台单元,用于与万维网建立数据连接,获取万维网中的数据信息;信息抓取单元,用于依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发;信息存储单元,用于接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份;信息运算处理单元,用于接收用户的操作请求,并依据操作请求在信息存储单元内获取数据信息,并进行运算处理;客户端反馈单元,用于键入用户的操作请求,并将信息运算处理单元的处理结果反馈给用户。

【技术特征摘要】
1.一种搜索引擎链接分析系统,包括:互联网云平台单元,用于与万维网建立数据连接,获取万维网中的数据信息;信息抓取单元,用于依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发;信息存储单元,用于接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份;信息运算处理单元,用于接收用户的操作请求,并依据操作请求在信息存储单元内获取数据信息,并进行运算处理;客户端反馈单元,用于键入用户的操作请求,并将信息运算处理单元的处理结果反馈给用户。2.根据权利要求1所述的搜索引擎链接分析系统,其特征在于,所述信息抓取单元包括:爬虫服务器,用于在万维网中抓取数据信息;网站服务器,用于接收用户的操作请求,依据操作控制爬虫服务器完成数据信息抓取,并将抓取到的数据信息转载下发。3.根据权利要求1所述的搜索引擎链接分析系统,其特征在于,所述信息运算处理单元包括:网段查询模块,用于查询网站IP所属的网段;域名查询模块,用于查询域名IP以及域名所有者信息;阈值设定模块,用于设置反链数上升速度阈值、外链增长速度阈值,相同链接数量阈值以及相互链接数量阈值,作为判断处理依据;反链数上升速度判断模块,用于检测网站反链数的上升速度并进行比对,当检测网站反链数上升速度超过反链数上升速度阈值时,对网站进行降权处理或重点监测处理;外链增长速度判断模块,用于检测网站外链的增长速度并进行比对,当检测网站外链增长速度超过外链增长速度阈值时,对网站的外链进行降权操作;初次内容比对模块,用于对比锚文件与链接页面内容,当锚文件与链接页面内容无关时,对外链进行降权操作;二次内容比对模块,用于对比网站反链页面和链接页面内容,当网站反链页面和链接页面内容无关时,对外链进行降权操作;网站外链分析模块,用于检测比对网站外链内容,获取网站内存在的链接相同的反链数量,当链接相同的反链数量大于相同链接数量阈值时,对网站或外链进行降权操作;网站内链分析模块,用于检测比对网站url链接内容,获取url链接相似网站间相互链接的数量,当相互链接的数量大于相互链接数量阈值时,对网站或外链进行降权操作。4.根据权利要求3所述的搜索引擎链接分析系统,其特征在于:所述锚文本为链接所在的上下文信息。5.根据权利要求1所述的搜索引擎链接分析系统,其特征在于,所述客户端反馈单元包括App客户端或Web客户端。6.一种搜索引擎链接分析方法,包括:S1、互联网云平台步骤,与万...

【专利技术属性】
技术研发人员:袁学文
申请(专利权)人:苏州闻道网络科技股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1