网页地址的获取方法和获取装置制造方法及图纸

技术编号：7111668 阅读：209 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种网页地址的获取方法和获取装置，方法包括：在浏览器启动时，初始化浏览器中预先嵌入的浏览器嵌入插件，并在浏览器嵌入插件的初始化过程中，向浏览器中注册浏览器嵌入插件的回调函数指针；在浏览器每次触发与打开网页相应的操作事件时，通过浏览器调用回调函数指针指向的回调函数、将操作事件引用或跳转的网页地址写入回调函数的相应参数中，以及通过浏览器嵌入插件解析回调函数并记录解析结果，直至解析结果满足预设结束条件；所述解析结果包括：每次触发的与打开网页相应的操作事件引用或跳转的网页地址，以及多次记录的网页地址之间的递归调用关系。本发明专利技术降低了获取网页地址所需的成本，提高了网页地址获取的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网安全技术，尤其涉及一种网页地址的获取方法和获取装置。
技术介绍
随着互联网网页制作技术的不断进步，可在同一个网页页面中通过多种方法引入其他网页页面并呈现给用户。网页页面的常用引入方法包括内框(iframe)法、引用 (include)法、浏览器下载(IE download)法、对象(object)等。这些方法写法各不相同，并且IE等浏览器对这些编程写法的格式要求并不严格，例如对程序中有无双引号、有无空格、前后的标签是否严格匹配等格式无严格要求，IE等浏览器可以识别和处理这些程序，从而保证了网页页面的兼容性。此外，引用法还支持网页页面的递归嵌套引用，例如在 “ 1 · html ” 中引用 “ 2. html ”，在 2. html ” 中引用 “ 3. html ”，在 “ 3. html ” 中引用 “ 4. html ”，以此类推，层层嵌套即递归调用。IE等浏览器根据网页地址之间的递归调用顺序依次访问相应网页。在实际应用中，如果发现某网站的某网页被植入木马，需要查找到从源网页(如该网站的首页)到目的网页(如感染木马或病毒的网页之间的所有链接，以便及时进行木马告警或查杀等处理。获取网页地址的一种现有技术是关键字查找法。关键字查找法是将网页识别为一个普通的文本文件，先完全下载下来，然后将网页读入程序中，程序中查询各种网页引用和网页跳转的关键字，然后通过关键字定位出要引用或跳转的网页地址。例如在网页 “l.html”中，通过字符串查找关键字“include”，那么就可以根据这个关键字就可以找到该网页要引用的网页地址〈include...

【技术保护点】
１．一种网页地址的获取方法，其特征在于，包括：在浏览器启动时，初始化所述浏览器中预先嵌入的浏览器嵌入插件，并在所述浏览器嵌入插件的初始化过程中，向所述浏览器中注册浏览器嵌入插件的回调函数指针；在所述浏览器每次触发与打开网页相应的操作事件时，通过所述浏览器调用所述回调函数指针指向的回调函数、将所述操作事件引用或跳转的网页地址写入所述回调函数的相应参数中，以及通过所述浏览器嵌入插件解析所述回调函数并记录解析结果，直至所述解析结果满足预设结束条件；所述解析结果包括：每次触发的与打开网页相应的操作事件引用或跳转的网页地址，以及多次记录的网页地址之间的递归调用关系。

【技术特征摘要】

【专利技术属性】
技术研发人员：高宁，邵晴，崔福东，
申请(专利权)人：北龙中网北京科技有限责任公司，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人