规避内容阻挡逻辑的操作的方法和系统技术方案

技术编号:3522675 阅读:213 留言:0更新日期:2012-04-11 18:40
一种规避置标语言文档传递系统中内容阻挡逻辑的操作的方法。在本发明专利技术的方法中,能够确定内容阻挡逻辑的操作。响应该确定,置于置标中的内容的引用能够被定位,并且可用别名代替内容的引用。最后,置标可被提供给发出请求的浏览器。这样,用别名代替引用可规避内容阻挡逻辑的操作。

【技术实现步骤摘要】

本专利技术涉及因特网安全领域,更具体地说,涉及内容过滤。
技术介绍
全球因特网代表自电视的出现以来,广告业的最重要发展。在全球因特网上广泛采用万维网之前,媒体市场局限于印刷、广播和电视广告。多数情况下,除了观看广告之外,目标个体没有任何选择。例如,就电视广播来说,广告可作为附加内容包含在广播流中,所述附加内容与广播节目不可区分。另外要注意的是在电视广播的环境中,先进的数字记录设备已被证明能够部分或者完全地从录制的电视节目中除去广告,即使广告难以区分。和电视广播媒体不同,在因特网媒体中,通常以定义电子文档的置标(markup)的嵌入部分的形式,传送广告。置标语言在本领域中众所周知,例如,不仅包括历史悠久的超文本置标语言(HTML),而且包括可扩展置标语言(XML),无线置标语言(WML),和标准通用置标语言(SGML)的许多变型。如同本领域的技术人员认识到的那样,除了可显示内容的其它形式之外,这种电子文档包括Web页。置标语言文档不仅能够定义可通过诸如Web浏览器(下面称为“浏览器”)之类内容浏览器查看的内容,而且能够定义可结合内容表现的补充内容。补充置标的内容不仅可包括广告(通常呈嵌入图像引用的形式),而且可包括嵌入媒体引用,其它置标语言文档的引用,置标语言片断,其它类型的文档,程序,脚本等。在这方面,补充内容可以是根据其中嵌入补充内容的引用的置标,可由浏览器加载或者可借助浏览器加载的任意内容。例子可包括可被自动加载的图像引用,或者响应用户事件,例如当用户在呈现于浏览器中的置标的规定部分上,拖过鼠标指示器时,能够被激活的脚本或页面。在操作上,当浏览器取回置标时,浏览器能够解析置标,以便表现文档。特别地,对于在置标内引用的内容的各个引用,浏览器能够取回引用的内容,并且随后能够如同所述引用规定的那样,在置标内或者结合所述置标表现该内容。重要的是,众所周知出于安全性和效率方面的原因,在内容和置标的来源与浏览器之间放入反向代理服务器(代理人)。具体地说,反向代理服务器能够服务于在置标内引用的补充内容。从而,对本领域的技术人员来说,代理人显然被布置成了解在表现置标的过程中,单个浏览器请求的补充内容的真实位置。和电视广播的情况一样,目标受众中的许多人不喜欢在浏览的时候被淹没于广告之中。此外,许多人希望限制补充内容的表现。通过内容阻挡技术的开发,市场已对这种已知的偏爱作出了响应。过滤代表这种内容阻挡技术的一个实施例。具体地说,过滤涉及统一资源标识符(URI)的各个部分与不需要内容的已知来源的联合。从而,每次浏览器(或者代表浏览器作用的正向代理服务器,视情况而定)识别引用内容的URI内的已知源串时,关于该内容的请求可被忽略,当表现置标时,可省略该内容。从而,被阻挡的内容决不会被取回、高速缓存、显示或者被用户看到。事实上,被阻挡的内容只是不能到达其目标受众。最初,只有富有技术经验的人们才采用内容阻挡技术,占在线群体的百分比相当小。许多专家认识到如果内容阻挡的功能和其它面向Web的软件打包在一起,那么内容阻挡会被更广泛地采用。目前,已开始在其它面向Web的产品内集成内容阻挡技术,例如把某一类别的内容阻挡技术包含在来自数个主要的安全和病毒检测制造商的软件中。内容阻挡的支持者声称通过不下载慢速加载的广告横幅和按钮,能够提高浏览速度。在这方面,慢速加载的补充内容会禁止浏览整个页面,直到补充内容装入或者超时为止。另一方面,内容阻挡的反对者注意到内容阻挡相当于偷窃,因为通过查看诸如广告之类的补充内容,ad-free网上冲浪人员使用主要内容提供者的有价值资源,而不间接“支付”主要内容的费用。一些主要内容发布者甚至拒绝内容阻挡访问者。如果被广泛采用,那么对于万维网的用户来说,内容阻挡会导致某些重要的无意识后果。例如,阻挡可被容易地识别为广告的任何内容实际上会鼓励更主动的收入产生模型。如果合法广告被消除,那么网站会感到压力,从而通过使用暗中支付的“社论式广告”(在房地产和汽车市场中情况已是如此)牺牲社论完整性(editorial integrity),在“社论式广告”中,付费广告伪装成无偏见的社论性意见。最后,可以想到的是如果主要内容提供者不再从补充内容获得收入,那么他们会创立新的商业模型,所述商业模型涉及通过置标向用户提供主要内容的预约或按次计费。目前,存在无意地能够有效规避内容阻挡的技术。具体地说,统一资源定位符(URL)重写已被用于掩蔽到内容位置的真实路径。然而,不加选择地使用URL重写会使高速缓存(增强Web页的响应的主要机制)失效。在URL重写不加选择地改变到内容的路径的情况下,会失去高速缓存的优点,并且会不必要地消耗网络带宽。因此,URL重写本身不能用作解决补充内容被阻挡问题的方案。
技术实现思路
本专利技术是规避置标语言(markup language)文档系统中内容阻挡逻辑(content blocking logic)的操作的系统、方法和机器可读存储器。补充置标的内容不仅可包括广告(一般呈嵌入的图像引用的形式),而且还包括嵌入的媒体引用,对其它置标语言文档的引用,置标语言片断,其它类型的文档,程序,脚本等。在本专利技术的方法中,能够确定内容阻挡逻辑的操作。响应该确定,置于置标中的内容的引用能够被定位,并用别名代替内容的引用。最后,置标可被提供给发出请求的浏览器。这样,用别名代替引用规避了内容阻挡逻辑的操作。值得注意的是,对于来自相同或其它浏览器的关于置标的后续请求,可重复该过程。在这方面,本专利技术的方法还可包括在提供步骤之后,用新的别名代替别名,并把具有新别名的置标提供给发出请求的浏览器。在本专利技术的一个优选方面,根据可逆的公式,新别名可不同于最近使用的别名,或者可按照循环方式从一组别名中选出。此外,在本专利技术的一个特殊实施例中,可在置标中插入一个刷新标记,命令在缩短的一段时间内刷新该置标。从而,在刷新之后,可利用新的别名实现定位、替换和提供步骤。确定步骤包括跟踪置于置标中的许多内容引用。确定步骤还可包括还跟踪关于当表现置标时产生的内容的许多请求。最后,确定步骤可包括当引用和请求之间的差异超过阈值时,确定已发生内容阻挡的步骤。在备选实施例中,确定步骤可包括统计上跟踪提供的内容的实例,并且当提供的补充内容中的一个特定补充内容未如同统计跟踪所示那样经常地被提供时,确定发生了内容阻挡。替换步骤可包括根据引用用公式表示别名,并用别名替换引用。因此,在本专利技术的另一具体实施例中,公式表示步骤可包括把别名编码成统一资源标识符(URI)串。在编码串内可散布文件系统定界符,以产生到内容的模拟路径。此外,本地文件系统的网络地址可与模拟路径相组合。从而,模拟路径和相对于引用的相关性可被记录在别名表中,以便当把模拟路径解除引用(dereferencing)成URI时之用。在更详细的举例说明中,可根据引用用公式表示别名,并可用所述别名替换引用。为此,可在别名表中产生一个条目,使别名与实际内容的位置相关联。这样,可根据别名,响应内容请求,取回实际内容。最好,只利用在URI中许可的那些字符,例如包括base-64编码,对别名编码。另外,就包括代表二进制日期-时间戳记或计数器的非许可字符来说,这样的非许可字符可被转换成许可的字符。本领域的技术人员会认识到本文档来自技高网
...

【技术保护点】
一种规避置标语言文档传递系统中内容阻挡逻辑的操作的方法,所述方法包括下述步骤:确定内容阻挡逻辑的操作;确定置标中对内容的引用的位置;在所述置标中用别名代替所述引用;和把所述置标提供给发出请求的浏览器;从而,利用所述别名的所述代替规避所述内容阻挡逻辑的操作。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:约翰R欣德马西娅L斯托克顿
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1