This application provides a phishing web page detection method and device. The method includes: call page rendering program access to detect web page detection process; in the rendering of the to be detected, the web page is sent to the user operation case; detecting the detected results of the phishing web page rendering based on. According to the embodiment of the invention, the phishing web pages open in normal rendering environment, avoid phishing web pages with normal web page source file which cannot detect the phishing web detection process; further to render, to be detected \user to send events, and a reality and browse the web as the environment simulation of the fishing web page to a user event in the monitoring operation will open the original page, to detect progress, avoid phishing detection to reality when accessing web pages show non phishing pages lead to phishing detection problems, improve the accuracy of detection\.
【技术实现步骤摘要】
一种钓鱼网页检测方法及装置
本申请涉及网页处理领域,特别是涉及一种钓鱼网页检测方法,以及一种钓鱼网页检测装置。
技术介绍
钓鱼网页主要是通过仿冒真实网站的URL地址或是页面内容,伪装成银行及电子商务等类型的网页,或是利用真实网页服务器程序上的漏洞,在网页中插入危险的网页代码,以此来骗取用户银行或信用卡账号、密码等私人资料。常规的钓鱼网页检测方案在检测一个URL是否是钓鱼网页时,通过访问该URL获取返回的网页源文件,例如HTML(超文本标记语言)文件,并解析提取其中的文本或图片特征,进一步基于提取的文本或图片特征进行识别。然而,这种常规的机器检测方法已经无法应对层出不穷的新型钓鱼网页,为绕过网页检测,新型钓鱼网页通常会判断当前是真人访问还是机器检测,若识别为机器检测,则反馈一个非钓鱼网页,造成检测引擎漏报。具体而言,新型钓鱼网页的网页源文件中通常会配置正常网页的文本或图片特征,只有在根据发生浏览器渲染行为确定为真人访问后,才会渲染出钓鱼网页,从而使得非浏览器环境的检测无法获取到钓鱼网页的识别依据,无法检测到钓鱼网页。进一步,即使采用浏览器环境检测钓鱼网页,有些钓鱼网 ...
【技术保护点】
一种钓鱼网页检测方法,其特征在于,所述方法包括:调用网页渲染程序访问待检测网页;在渲染所述待检测网页的过程中,向所述待检测网页发送用户操作事件;基于所述待检测网页的渲染结果进行钓鱼网页的检测。
【技术特征摘要】
1.一种钓鱼网页检测方法,其特征在于,所述方法包括:调用网页渲染程序访问待检测网页;在渲染所述待检测网页的过程中,向所述待检测网页发送用户操作事件;基于所述待检测网页的渲染结果进行钓鱼网页的检测。2.根据权利要求1所述的方法,其特征在于,所述网页渲染程序为真实浏览器或基于开源的渲染引擎编写的模拟浏览器,所述开源的渲染引擎包括Webkit渲染引擎或Gecko渲染引擎。3.根据权利要求1所述的方法,其特征在于,所述用户操作事件包括键盘事件时,所述向所述待检测网页发送用户操作事件包括:基于预定义的键盘按键创建键盘事件,向所述待检测网页发送所述键盘事件。4.根据权利要求1所述的方法,其特征在于,所述用户操作事件包括鼠标事件时,所述向所述待检测网页发送用户操作事件包括:以当前鼠标所处位置为起点生成鼠标移动路径,创建记录所述鼠标移动路径的鼠标移动事件,向所述待检测网页发送所述鼠标移动事件。5.根据权利要求1所述的方法,其特征在于,所述用户操作事件包括鼠标事件时,所述向所述待检测网页发送用户操作事件包括:基于所述当前鼠标所处位置创建鼠标点击事件,向所述待检测网页发送所述鼠标点击事件。6.根据权利要求1所述的方法,其特征在于,所述网页渲染程序支持JavaScript和FLASH中至少一种。7.根据权利要求1所述的方法,其特征在于,所述基于渲染后的待检测网页进行钓鱼网站的检测包括:提取所述待检测网页的图像特征;基于获得的图像特征识别所述待检测网页是否为钓鱼网页。8.根据权利要求7所述的方法,其特征在于,所述渲染结果在所述网页渲染程序中进行展示,所述提取所述待检测网页的图像特征包括:对在所述网页渲染程序中展示的待检测网页进行网页截图。9.根据权利要求7所述的方法,其特征在于,所述渲染结果在所述网页渲染程序中不做展示,所述提取所述待检测网页的图像特征包括:将所述待检测网页的渲染结果转换为图像数据;获取所述图像数据作为所述待检测网页的图像特征。10.根据权利要求8或9所述的方法,其特征在于,所述基于获得的图像特征识别所述待检测网页是否为钓鱼网页包括:提取所述图像特征的局部不变特征;结合提取的局部不变特征与预置的合法网页的局部不变特征,统计所述待检测网页与对应的合法网页的相似度;若所述相似度低于预设值,则确定所述待检测网页为钓鱼网页。11.一种钓鱼网页检测装置...
【专利技术属性】
技术研发人员:叶敏,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。