基于随机字体的网页文本加密与解密方法技术

技术编号:26172104 阅读:36 留言:0更新日期:2020-10-31 13:47
本发明专利技术提供一种基于随机字体的网页文本加密与解密方法,属于互联网技术领域。通过随机生成CMAP中字符与字型映射关系的方式,快速产生自定义字体,对网页中特定字符进行加密渲染,导致无法在网页原始文本中直接获取数据,有效保护关键数据在网页环境中无法被窃取。该方法不会对整体样式产生任何影响,保持了样式的统一;字体文件仅仅描述了字形的矢量信息,相较图片占用空间很小,字体绘制则完全由浏览器完成,几乎不会对用户体验产生影响;该方法给部分爬虫的恶意采集造成了有效障碍,减少了网站遭受恶意攻击的风险,同时节省了在许多无效访问中消耗的大量人力、物力和金钱成本,对于提高公司产品的用户体验度和满意度具有重要的意义。

【技术实现步骤摘要】
基于随机字体的网页文本加密与解密方法
本专利技术涉及互联网
,特别涉及网页字体显示信息的加密和解密过程。
技术介绍
随着互联网技术的快速发展,网络成为大量信息的载体,各类终端可以从网络上获取用户所需的信息,并通过网页的形式进行显示。互联网时代,每天都在产生海量的公开数据,网页中存在许多有价值的关键数据(如电商网站中的商品销量、价格信息),在这些数据中蕴含着难以估量的巨大价值,因此以获取互联网公开数据信息的爬虫技术应运而生。但是对于网站的运营者来说,部分恶意爬虫的运行造成了大量的网络访问流量,给运行网站的服务器增大了并发与网络带宽压力,极大地增加了网站运行的成本。对于互联网公司来说,数据是公司的重要资源。哪怕是面向用户公开的数据信息,在收集到一定数量的时候也能获取到许多有价值的信息。而这些信息往往并不想被竞争对手或灰色产业获取并利用。在对抗爬虫的过程中,既要不让爬虫程序获取到真实信息,又要确保真实用户能够获取到真实信息,这往往是一种矛盾。如将网页中的部分文字替换成图片,虽有效地加大了爬虫获取正确信息的难度,却也因为大量图片的本文档来自技高网...

【技术保护点】
1.一种基于随机字体的网页文本加密与解密方法,其特征在于,包括步骤如下:/n步骤S1.提取网页中需要加密的字符集;/n步骤S2.建立加密字符的映射关系,生成加密映射表cipher book;/n步骤S3.创建字体文件;/n步骤S4.修改字体CMAP表:/n步骤S5.编辑字形索引glyph_index;/n步骤S6.将编辑后的字体文件在页面CSS中引用;/n步骤S7.使用步骤S2定义的加密映射表对网页正文中的内容进行替换;/n步骤S8.将网页内容及字体返回浏览器即可查看渲染后的页面,此时页面显示字符正常,但复制出来的文本字符是经过加密的文本;/n步骤S9.在拥有字符映射的情况下,后台可直接使用映...

【技术特征摘要】
1.一种基于随机字体的网页文本加密与解密方法,其特征在于,包括步骤如下:
步骤S1.提取网页中需要加密的字符集;
步骤S2.建立加密字符的映射关系,生成加密映射表cipherbook;
步骤S3.创建字体文件;
步骤S4.修改字体CMAP表:
步骤S5.编辑字形索引glyph_index;
步骤S6.将编辑后的字体文件在页面CSS中引用;
步骤S7.使用步骤S2定义的加密映射表对网页正文中的内容进行替换;
步骤S8.将网页内容及字体返回浏览器即可查看渲染后的页面,此时页面显示字符正常,但复制出来的文本字符是经过加密的文本;
步骤S9.在拥有字符映射的情况下,后台可直接使用映射表进行解密。


2.根据权利要求1所述的一种基于随机字体的网页文本加密与解密方法,其特征在于,执行步骤S1时,随机在网页文本中选择部分文本字符作为加密字符集,不进行全文加密。


3.根据权利要求1或2所述的一种基于随机字体的网页文本加密与解密方法,其特征在于,执行步骤S2时,将需要加密字符的unicode编码映射到其他字符,其他字符为字体库中不太常用的高位字符,或是毫不相关的字符。


4.根据权利要求1或2所述的一种基于随机字体的网页文本加密与解密方法,其特征在于,步骤2生成的加密映射表cipherbook在后端保存。


5.根据权利要求1或2所述的一种基于随机字体的网页文本加密与解密方法,其特征在于,执行步骤S3时,使用已有的字体文...

【专利技术属性】
技术研发人员:杨照通杨胜华叶秋萍
申请(专利权)人:浪潮卓数大数据产业发展有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1