一种信息安全性的处理方法和系统技术方案

技术编号:8271447 阅读:188 留言:0更新日期:2013-01-31 03:40
本发明专利技术公开了一种信息安全性的处理方法和系统,所述方法包括:根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果;对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。本发明专利技术通过识别发生篡改的搜索结果和/或发生跳转的搜索结果,将存在潜在危险的搜索结果告知用户甚至直接过滤掉,从而大大提高了搜索结果的有效性和安全性。

【技术实现步骤摘要】
本专利技术属于信息安全领域,具体地说,涉及一种信息安全性的处理方法和系统
技术介绍
搜索引擎是一种广泛应用的互联网技术,其可以概述为运用一定的策略从互联网上抓取网页以收集信息,对收集到的信息提取关键词并建立索引文件、去除重复网页等处理后收录到索引数据库中,当用户输入检索关键词时候,搜索引擎从索引数据库中找到匹配该检索关键词的网页,即滤出与检索关键词有关的内容,并展现给用户。目前,一些网站会篡改其他正常网站的页面内容,把与其本身有关的关键词埋放到其他正常网站页面中,从而利用搜索引擎的上述机制使搜索引擎收录埋放有所述关键词的其他正常网站;还有一些钓鱼网站主动将热门关键词埋放到自己的网站页面,将自己伪装成热门搜索关键词的相关网站,从而可以被搜索引擎收录。当用户在实际搜索时,搜索引擎会显示与用户输入的关键词匹配的结果,这其中可能就包括已被篡改过的正常网站,甚至包括伪装的钓鱼欺诈网站,显然,这样的搜索结果违背了用户的搜索意图,造成了大量的无效搜索结果,而且钓鱼欺诈网站更是为搜索引擎的使用带来极大的安全隐患。另外,对于上述被篡改过页面内容的正常网站,还可能针对搜索引擎被做了跳转处理,如果用户直接点击本文档来自技高网...

【技术保护点】
一种信息安全性的处理方法,包括:根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果;对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。

【技术特征摘要】
1.一种信息安全性的处理方法,包括 根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果; 根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果; 对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。2.根据权利要求I所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括 收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果; 抓取每个搜索结果的网页快照以及每个搜索结果的网址链接; 根据所述预置关键词与所述网页快照在文字内容进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而获取所述搜索结果中存在的一个或多个被利用的搜索结果。3.根据权利要求I或2所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括 收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果; 抓取每个搜索结果的网址链接; 根据所述真实网页网址与所述网址链接的匹配关系来获取所述搜索结果中存在的一个或多个被利用的搜索结果。4.根据权利要求1-3中任一项所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括 收集所述预置关键词对应的一个或多个搜索结果; 抓取每个搜索结果的网页快照; 根据所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性来获取所述搜索结果中存在的一个或多个被利用的搜索结果。5.根据权利要求1-4中任一项所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括 收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果; 抓取每个搜索结果的网页快照以及每个搜索结果的网址链接; 根据所述预置关键词与所述网页快照在文字内容上进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果; 当初步确定所述被利用的搜索结果后,根据所述被利用的搜索结果的网页快照以及所述被利用的搜索结果被访问后开启的页面,两者在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。6.根据权利要求1-5中任一项所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果; 抓取每个搜索结果中的网址链接; 根据所述真实网页网址与所述网址链接的匹配关系来初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果; 当初步确定出所述被利用的搜索结果后,根据所述网页快照以及所述搜索结果被访问后开启的页面在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。7.根据权利要求1-6中任一项所述的方法,其中,根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,进一步包括 根据所述检索关键词,与所述数据库中预置关键词进行匹配; 当所述检索关键词与所述预置关键词匹配时,根据所述检索关键词对应的搜索结果列表,与所述数据库中所述被利用的搜索结果进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。8.根据权利要求1-7中任一项所述的方法,其中,根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,进一步包括 根据所述检索关键词对应的搜索结果列表,与所述数据库中被利用的搜索结果进行匹配; 当所述搜索结果列表中匹配到所述被利用的搜索结果时,再根据所述检索关键词,与所述数据库中所述预置关键词进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。9.根据权利要求1-8中任一项所述的方法,其中, 通过查询接口获取所述搜索引擎中所使用的检索关键词及其对应的搜索结果列表。10.根据权利要求1-9中任一项所述方法,其中,对存在危险的搜索结果进行安全性处理,进一步包括 在所述检索关键词对应搜索结果中,对包括所述被利用的搜索结果的搜...

【专利技术属性】
技术研发人员:刘起赵冠捷钱军
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1