当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于HTML代码的网页水印的嵌入与提取方法技术

技术编号:18592615 阅读:113 留言:0更新日期:2018-08-04 20:05
本发明专利技术涉及基于HTML代码的网页水印的嵌入方法,包括如下步骤:步骤1)对水印信息进行预处理,将水印字符串转换成一定形式的编码,所述编码由若干码元组成;步骤2)设定若干空样式,每个空样式对应一所述码元,形成一个空样式表;步骤3)将空样式作为一个叠加的样式嵌入到当前网页的HTML代码中已存在的样式之后。有益效果:本方法以空样式的方式将水印嵌入到网页的HTML代码中,不易被察觉和发现,具有很好的隐蔽性。

A method of embedding and extracting webpage watermark based on HTML code

The invention relates to the embedding method of Web watermarking based on HTML code, including the following steps: Step 1) preprocess the watermark information and convert the watermark string into a certain form of encoding; the encoding is composed of several symbols; step 2) set a number of empty styles, each empty style corresponds to one of the symbols, and forms one. Null style sheets; Step 3) Embeds null style as an overlay style after existing styles in the HTML code of the current page. Beneficial effect: This method embeds watermark into HTML code of web pages in empty style, which is not easy to be detected and found, and has good concealment.

【技术实现步骤摘要】
一种基于HTML代码的网页水印的嵌入与提取方法
本专利技术涉及互联网安全领域,尤其涉及一种基于HTML代码的网页水印的嵌入与提取方法。
技术介绍
随着信息技术和互联网的普及发展,网页的非法复制、网页的仿冒现象日益严重,是一个亟待解决的问题。由于本专利技术涉及到网页HTML代码中的样式,在阐述本专利技术的技术方案之前,简要对样式做一说明:网页是一种存储在Web服务器上,通过网络进行传输,被浏览器解析和显示的文档类型,其内容由HTML语言构成。网页的样式是使网页页面显示达到一定效果的辅助代码,它可以改变网页中元素的外观,如按钮的颜色、表格的大小等。网页的样式一般会用层叠样式表CSS进行封装,将一系列样式封装在一起放在CSS文件中。HTML使用样式名调用封装的样式,显示样式所定义的外观。例如样式调用<divclass=“suspendsusp_nav”>content</div>,其中suspend和susp_nav是两个封装好的样式,div层中的content的显示效果就是这两个样式效果的叠加效果。样式通常由样式名和表示样式内容的定义构成。网页水印是近年来出现的保护网页的一项技术,它通过某种方式在网页中嵌入版权标识信息或身份认证信息(水印),当发现网页遭到非法复制或仿冒时,可以提取这些信息来证明网页的版权归属,鉴别网页的真伪,确认非法复制和仿冒行为。除此之外,网页水印技术还可用于网页防篡改、在网页中隐藏和传递秘密信息等。与传统的图像、视频和音频水印技术的研究相比,网页水印技术的研究目前还很少。网页的构造与图像、音频文件不同,常用的图像和音频水印技术不适用于网页水印。另一方面,表示网页的HTML代码结构简单、冗余度少,在网页中嵌入水印难度较大。现有的一些网页水印方法主要是通过改变标签名或属性名的大小写、改变空格的个数、使用不同的代码格式等方法嵌入水印。这些方法存在明显的不足,嵌入的水印信息与HTML代码内容严重脱离,隐蔽性不好,容易受到代码检测和代码过滤的攻击,有的方法水印信息的嵌入点很少,水印信息容量小。
技术实现思路
本专利技术目的在于克服上述现有技术的不足,提供了一种基于HTML代码的网页水印的嵌入与提取方法,具体由以下技术方案实现:所述基于HTML代码的网页水印的嵌入方法,包括如下步骤:步骤1)对水印信息进行预处理,将水印字符串转换成一定形式的编码,所述编码由若干码元组成;步骤2)设定若干空样式,所述空样式的内容均不进行定义,每个空样式唯一地对应一所述码元,形成一个空样式表;步骤3)将水印字符串编码中每个码元对应的空样式作为一个叠加的样式,按码元排列的先后顺序逐个嵌入到当前网页HTML代码中已存在的各个样式之后。所述的基于HTML代码的网页水印的嵌入方法的进一步设计在于,所述步骤1)中对水印信息进行预处理采用UNICODE编码,形成十六进制的水印信息码串。所述的基于HTML代码的网页水印的嵌入方法的进一步设计在于,编码由十六个码元表示。所述的基于HTML代码的网页水印的嵌入方法的进一步设计在于,所述空样式的名称与网页现有的样式名不相同。根据所述的基于HTML代码的网页水印的嵌入方法,提供一种对应的水印提取方法,其特征在于包括如下步骤:步骤a)提取空样式:根据空样式表中的样式名,从网页的HTML代码中依次提取出每个空样式;步骤b)生成水印信息码串:对照空样式表,将提取的每个空样式转换成对应的码元,并将所述码元按对应空样式的提取顺序拼接形成水印信息码串;步骤c)生成原始水印信息:根据编码的形式将水印信息码串转换成对应的水印信息字符串。本专利技术的优点如下:本专利技术提出的网页水印技术将水印信息以空样式的方式嵌入到网页的HTML代码中,不易被察觉和发现,具有很好的隐蔽性。嵌入的水印具有良好的抗攻击性,包括抗检测性和抗过滤性。由于样式内容的定义通常存放在CCS文件中,水印的攻击者根据HTML代码难以区分出其中的真实样式和空样式,无法检测到空样式的存在。如果试探性地修改样式名,会有很大的风险,若是改动了真实的样式名,会对页面的显示效果产生很大的影响,因此很难用过滤系统去除网页中的空样式。同时,这种方法也有足够的水印信息嵌入空间,因为样式在网页的HTML代码中大量的存在。附图说明图1为原始网页页面截图。图2为水印信息预处理示意图。图3为嵌入水印后的网页页面截图。图4为水印提取过程示意图。具体实施方式以下结合附图,对本专利技术的技术方案进行详细说明。基于HTML代码的网页水印的嵌入方法,包括如下步骤:基于HTML代码的网页水印的嵌入方法,包括如下步骤:步骤1)对水印信息进行预处理,将水印字符串转换成一定形式的编码,编码由若干码元组成。步骤1)中,为便于嵌入包含中英文在内的水印信息,水印信息预处理采用UNICODE编码,形成十六进制的水印信息码串。如字符串“copyright南通大学”,转换为UNICODE码为:\u0063\u006f\u0070\u0079\u0072\u0069\u0067\u0068\u0074\u5357\u901a\u5927\u5b66去除每个字符编码的码头\u,得到处理后的水印信息:0063006f00700079007200690067006800745357901a59275b66。当然本专利技术也可以ASCII编码方式进行编码,由于该编码方式为本领域技术人员的常规技术手段,故在此不再赘述。步骤2)设定若干空样式,每个空样式与上述构成水印信息字符串的码元一一对应,形成一个空样式与码元的对应表。步骤2)中,空样式定义为:一个样式只有样式名,没有内容定义。例如,样式调用<divclass=“susp”>content</div>,如果CSS文件中没有样式名为susp的样式定义,HTML代码中也没有定义susp的样式,那么susp为空样式。根据CSS规范,HTML中的元素不会匹配错误的或者不存在的样式名,因此上述调用不会进行任何操作。同时,上述调用不违反HTML的语法规范,对网页的运行不会产生任何影响。本专利技术利用HTML的这种特性,将水印信息转换为自定义的空样式名嵌入到HTML代码中,实现水印的嵌入与提取。对应于UNICODE编码方式,本实施例的编码由十六个码元表示,码元分别为数字0~9和字母a~f,形成的空样式表如表1所示。表1进一步的,空样式的样式名称的命名遵循两个方面的原则。一方面,样式的名字与HTML代码的内容要有一定的联系,具有合理性和真实性,让人觉察不到它是空样式,从而使水印具有良好的隐蔽性。另一方面,空样式的名字不能与现有样式的名字相同,如果命名相同,会导致水印信息提取出错。如本实施例以中国某银行官网信用卡页面为水印嵌入对象,其HTML代码中定义了名为“aright”的样式,故可以设计一个名为“bright”的空样式(即表1中码元5对应的样式),这个空样式名与真实的样式名很相似,让人难以分辨。步骤3)将水印字符串编码中每个码元对应的空样式作为一个叠加的样式,按码元排列的先后顺序逐个嵌入到当前网页HTML代码中已存在的各个样式之后。在HTML代码中,网页上要显示的内容通常包含在一个个的本文档来自技高网
...

【技术保护点】
1.一种基于HTML代码的网页水印的嵌入方法,其特征在于包括如下步骤:步骤1)对水印信息进行预处理,将水印字符串转换成一定形式的编码,所述编码由若干码元组成;步骤2)设定若干空样式,所述空样式的内容均不进行定义,每个空样式唯一地对应一所述码元,形成一个空样式表;步骤3)将水印字符串编码中每个码元对应的空样式作为一个叠加的样式,按码元排列的先后顺序逐个嵌入到当前网页HTML代码中已存在的各个样式之后。

【技术特征摘要】
1.一种基于HTML代码的网页水印的嵌入方法,其特征在于包括如下步骤:步骤1)对水印信息进行预处理,将水印字符串转换成一定形式的编码,所述编码由若干码元组成;步骤2)设定若干空样式,所述空样式的内容均不进行定义,每个空样式唯一地对应一所述码元,形成一个空样式表;步骤3)将水印字符串编码中每个码元对应的空样式作为一个叠加的样式,按码元排列的先后顺序逐个嵌入到当前网页HTML代码中已存在的各个样式之后。2.根据权利要求1所述的基于HTML代码的网页水印的嵌入方法,其特征在于所述步骤1)中对水印信息进行预处理采用UNICODE编码,形成十六进制的水印信息码串。3.根据权利要求2所述的基于...

【专利技术属性】
技术研发人员:陈建平陈韦旭文万志王进顾翔蔡亮
申请(专利权)人:南通大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1