The public embodiment relates to a method and device for searching and identifying infringing websites. In this method, firstly, the key information which can describe the specific business of the infringed website is determined. Then, based on the key information, the private web crawler search system searches the web pages containing the matching information with the key information in the network, and finally displays the search results to the users. Compared with the existing search and identification methods, which can only be found passively when the rights of the target site have been infringed, the method provided in the present disclosure can actively search for suspected infringement sites on the network 24 hours a day, so as to discover early and effectively avoid losses caused by malicious infringement of certain sites. Moreover, the method provided by the public embodiment is time-saving and efficient, and can effectively save manpower and material resources.
【技术实现步骤摘要】
侵权网站搜索识别方法及装置
本公开的实施例涉及互联网领域,尤其涉及侵权网站搜索识别方法及装置。
技术介绍
目前,伪造他人网站、未经允许访问他人网站或调用他人网站某项功能之类的侵权非法行为屡屡发生,对于侵权网站的检测难度也逐渐增大。从网页页面设计相似度来看,如果侵权网站模仿被侵权网站非常近似,常常让用户真假莫辨,也会躲过被侵权网站所建立的各种识别防范系统的监测;从行为上来看,如果调用被侵权网站的某项功能频率很高,在调用的动作几乎一样、尤其在调用时动作很隐蔽(如接口调用)的情况下,这些行为就如溪水汇入海洋一样,很难发现哪滴水是从哪个小溪流入大海的;不仅如此,某种调用的功能(如二维码防伪及银行转账接口)又不允许以授权许可的方式允许其他网站调用,在这种情况下常给不法分子以可乘之机。现有的侵权网站识别往往都是采用建立侵权网站识别特征数据库或侵权网站网址库,在访问被侵权网站或调用被侵权网站某项功能时通过侵权网站识别特征数据库或侵权网站网址库进行此对,显示侵权网站与侵权网站识别特征的相似度以提醒使用者注意或禁止对侵权网站访问或调用。然而,在专利技术创造的过程中,专利技术人发现通 ...
【技术保护点】
1.一种侵权网站搜索识别方法,其特征在于,所述方法包括:确定目标网站对应的关键信息,所述关键信息为描述目标网站特定业务的信息;根据所述关键信息,基于专用网络爬虫搜索系统,在网络中搜索第一网页得到搜索结果,所述第一网页包含与所述关键信息相匹配的信息;展示所述搜索结果。
【技术特征摘要】
1.一种侵权网站搜索识别方法,其特征在于,所述方法包括:确定目标网站对应的关键信息,所述关键信息为描述目标网站特定业务的信息;根据所述关键信息,基于专用网络爬虫搜索系统,在网络中搜索第一网页得到搜索结果,所述第一网页包含与所述关键信息相匹配的信息;展示所述搜索结果。2.根据权利要求1所述的方法,其特征在于,所述关键信息包括关键词信息和/或关键语句信息;所述关键词信息包括一个关键词或多个关键词的逻辑组合;所述关键语句信息包括一个关键语句或多个关键语句的逻辑组合。3.根据权利要求2所述的方法,其特征在于,所述第一网页包含与所述关键信息相匹配的信息是指:在所述关键信息包含关键词信息时,所述第一网页存在如下情况:在所述关键词信息为一个关键词时,所述第一网页中包含该关键词或该关键词的近义词;在所述关键词信息为多个关键词的逻辑组合时,所述第一网页中包含该多个关键词或其近义词的逻辑组合;在所述关键信息包含关键语句信息时,所述第一网页中包含与该关键语句信息相同文字比例达到预设阈值的语句。4.根据权利要求1所述的方法,其特征在于,在网络中搜索第一网页的步骤,包括:在网络内的满足预设条件的网页中搜索第一网页;所述预设条件包括:条件一、该网页所在网站的域名没有存储在侵权网站数据库中;或,该网页所在网站的域名已存储在所述侵权网站数据库中但所述网站的域名存储在预设的例外名单中,且该网页没有收录到侵权网站数据库中;其中,所述侵权网站数据库用于收录经过识别的侵权网站的域名以及该网站下侵权网页的网址,所述例外名单用于存储域名已存储在侵权网站数据库中但仍需对其进行搜索的网站域名;条件二、该网页所在网站不是所述目标网站;以及条件三、当前的搜索结果中不包含与该网页在同一域名下的相关网页。5.根据权利要求1所述的方法,其特征在于,所述展示所述搜索结果,包括:在检测到用户登录到指定的结果查看账户后,按预设规则向该账户展示所述搜索结果;所述预设规则包括:...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。