当前位置: 首页 > 专利查询>王秋池专利>正文

一种针对htm/html信息隐藏系统技术方案

技术编号:6792658 阅读:365 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种针对htm/html的信息隐藏系统,属于信息安全领域。本发明专利技术的目的在于解决用户隐私,用户敏感信息不被他人所窥视,使得htm在传输网页的同时传输了私有信息,存储的文件中看似一个普通的文档,里面其实包含用户隐私。此系统是通过对htm/html标签的解读和运用,实现了信息的藏匿,得到了一个针对htm/html的信息隐藏系统。

【技术实现步骤摘要】

本专利技术应用于信息安全,信息数字化,信息传输和移动存储。
技术介绍
隐写术是关于信息隐藏,即不让计划的接收者之外的任何人知道信息的传递事件 (而不只是信息的内容)的一门技巧与科学。隐写术英文作“steganography”,来源于约翰尼斯·特里特米乌斯的一本看上去是有关黑魔法,实际上是讲密码学与隐写术的一本书 《Steganographia》中。此书书名来源于希腊语,意为“隐秘书写”。信息隐藏是指在设计和确定模块时,使得一个模块内包含的特定信息(过程或数据),对于不需要这些信息的其他模块来说是透明的。HTML (Hyper Text Mark-up Language)即超文本标记语言或超文本链接标示语言,是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。HTML文本是由 HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。 HTML的结构包括头部(Head)和主体(Body)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。针对三者特色,我们将其综合到一块。针对htm/html的信息隐藏,即针对htm/ html的信息隐写,就是将敏感信息通过打包编码后使其作为一个整体,主要解决不同类型信息,比如多个文件。将信息打包后,我们将其放大到原来的八倍,并按照特定的算法将信息嵌入到原始的html载体中,新形成的信息巧妙的利用html自解析,伪装后的html和普通html外观上无任何区别,通过伪装自己,迷惑攻击者,使得传输原有信息的基础上,为敏感信息的传递开启了一条绿色通道。敏感信息还可以通过加密算法使得即使信息不幸泄漏,仍留有最后一道屏障,为信息的安全传输提供了一道新的防护墙。
技术实现思路
1、本专利技术是一种针对htm/html文本格式的信息隐藏系统,此系统由htm/html超文本识别模块、信息收集模块、信息处理模块和提取模块组成。2、
技术实现思路
1所述的二维条码信息索引生成模块包含以下实现步骤(1) htm/html文本被序列化后,我们将其看做一个bitstream,对于bitstream按照官方对htm/html的解释,将其信息分为<HTML><HEAD><title>, <base>, <link>, <isindex>, <meta></HEAD><B0DY>HTML文件的正文写在这里......</B0DY></HTML>(2)在1的基础上计算出正文的内容(3)计算失败则整个隐藏过程宣告失败3、
技术实现思路
1所述的信息收集模块包含以下实现步骤(1)将需要被隐藏的信息通过标准的算法进行打包;(2)将打包后的文件序列化为特定符号供信息处理模块进行进一步加工;4、
技术实现思路
1所述的信息处理模块包含以下实现步骤(1)在2(1)所提取出的文本信息中找到合适的位置并将该位置作为隐藏信息的入口,入口的选定上按照特定的算法生成。(2)信息隐藏的入口和信息提取的入口作为共享点,首先判断原文是否已经被处理过,如果被处理过,则先将曾经藏匿在此的信息剔除。(3)按照1 8的比例放大被3所序列化的信息,将其直接写入html中,放大后的序列根据html的解析规则,这些信息肉眼是不可见的。(4)信息提取,提取过程和隐藏过程类似,得到入口点后,检测是否有信息,如果没有,则提取失败;否则按照8 1的比例对信息进行缩小,缩小后所得即为打包后的信息,将信息拆包即得到原始信息。具体实施例方式本专利技术的目的、优点和特色由以下数个实施例之详细说明及图式当可更加明白, 这些实施例作为实施方式之举例说明,其目的是为方便详加说明本专利技术,而非用以限定本专利技术。实施案例-编码任给一段htm网页文档,我们以mm. baidu. com网页为例,生成一张含有隐写信息的htm网页文件。假设要隐藏的信息为’ china’ .通过查询ascii码表得知 china = 63H,68H,69H,6EH,61H = 0110 0011(B),0110 1000 (B),0110 1001(B),0110 1110 (B) 01100001 (B),将此信息通过算法三序列化后得到09 20 20 09 09 09 20 20 09 20 20 09 20 09 09 09 09 20 20 09 20 09 09 20 09 20 20 0920 20 20 09 09 20 20 09 09 09 09 20这样信息就被放大了 8倍,并且由于这些数字在网页或者记事本中都是不可见的,可以直接被写到网页的内容中。假设我们以body之前为此信息的潜入口,则直接将此序列插入到原始文本中即可。实施案例-解码由于事先我们知道在<body>之前是隐写信息之所在,在<body>之前检测是否存在隐写标记,如果存在,则去寻找信息头,找到后的信息是09和20组成的伪二进制流,只需要做一个8 1的解码即可得到原始数据流,通过对这个流进行运算最终得到隐藏前的信息。通过扫描将得到 09 20 20 09 09 09 20 20 09 20 20 09 2009 09 09 09 20 20 09 20 09 09 20 09 20 20 09 20 20 20 09 09 20 20 09 09 09 09 20 序列,按照 09 为 0, 20 为 1 的原则,得到 0110 001101101000011010010110111001100001,转化为 16 进制后得 6368696E61,查询ASCII表得china.与隐藏前信息刚好一致。权利要求1.本专利技术是一种针对htm/html超文本协议的信息隐藏系统,其特征是包含如下模块 htm/html超文本识别模块、信息收集模块、信息处理模块和信息提取模块。2.根据权利要求1所述的信息收集模块,其特征是原始信息通过标准的zlib算法将原有信息进行压缩和打包处理,处理后的文件使用高级加密标准(Advanced Encryption Standard, AES)Rijndael 算法进行加密。3.根据权利要求1所述的信息处理模块,其特征是数据处理部分将2过程所得到的信息按照1 8的比例放大,放大后的信息类似于原文中一个bit现在用一个byte来表示, 新形成的信息按照html自解释的规则进行嵌入,嵌入的方法是直接嵌入到原有htm/html 主干中。嵌入的信息由于有特殊标记,所以能够被提取模块准确无误的提取出。4.根据权利1所述的信息提取模块,在3的基础上被标记后能够被轻易的识别出,提取算法即为嵌入算法的逆算法。全文摘要本专利技术是一种针对htm/html的信息隐藏系统,属于信息安全领域。本专利技术的目的在于解决用户隐私,用户敏感信息不被他人所窥视,使得htm在传输网页的同时传输了私有信息,存储的文件中看似一个普通的文档,里面其实包含用户隐私。此系统是通过对htm/html标签的解读和运用,实现了信息的藏匿,得到了一个针对htm/html的信息隐藏系统。文档编号G06F21/00GK102226906SQ201110148640公本文档来自技高网
...

【技术保护点】
1.本专利技术是一种针对htm/html超文本协议的信息隐藏系统,其特征是包含如下模块:htm/html超文本识别模块、信息收集模块、信息处理模块和信息提取模块。

【技术特征摘要】

【专利技术属性】
技术研发人员:王秋池张无忌董新宇
申请(专利权)人:王秋池张无忌董新宇
类型:发明
国别省市:90

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1