基于随机字体的网页文本加密与解密方法技术

技术编号:26172104 阅读:20 留言:0更新日期:2020-10-31 13:47
本发明专利技术提供一种基于随机字体的网页文本加密与解密方法,属于互联网技术领域。通过随机生成CMAP中字符与字型映射关系的方式,快速产生自定义字体,对网页中特定字符进行加密渲染,导致无法在网页原始文本中直接获取数据,有效保护关键数据在网页环境中无法被窃取。该方法不会对整体样式产生任何影响,保持了样式的统一;字体文件仅仅描述了字形的矢量信息,相较图片占用空间很小,字体绘制则完全由浏览器完成,几乎不会对用户体验产生影响;该方法给部分爬虫的恶意采集造成了有效障碍,减少了网站遭受恶意攻击的风险,同时节省了在许多无效访问中消耗的大量人力、物力和金钱成本,对于提高公司产品的用户体验度和满意度具有重要的意义。

【技术实现步骤摘要】
基于随机字体的网页文本加密与解密方法
本专利技术涉及互联网
,特别涉及网页字体显示信息的加密和解密过程。
技术介绍
随着互联网技术的快速发展,网络成为大量信息的载体,各类终端可以从网络上获取用户所需的信息,并通过网页的形式进行显示。互联网时代,每天都在产生海量的公开数据,网页中存在许多有价值的关键数据(如电商网站中的商品销量、价格信息),在这些数据中蕴含着难以估量的巨大价值,因此以获取互联网公开数据信息的爬虫技术应运而生。但是对于网站的运营者来说,部分恶意爬虫的运行造成了大量的网络访问流量,给运行网站的服务器增大了并发与网络带宽压力,极大地增加了网站运行的成本。对于互联网公司来说,数据是公司的重要资源。哪怕是面向用户公开的数据信息,在收集到一定数量的时候也能获取到许多有价值的信息。而这些信息往往并不想被竞争对手或灰色产业获取并利用。在对抗爬虫的过程中,既要不让爬虫程序获取到真实信息,又要确保真实用户能够获取到真实信息,这往往是一种矛盾。如将网页中的部分文字替换成图片,虽有效地加大了爬虫获取正确信息的难度,却也因为大量图片的使用造成网页获取与渲染的时间增加,因为图片本身的不可编辑性造成样式排版的偏差,从而影响了用户的使用体验。而随着前端技术的发展,这一目标变为可能。在爬虫访问的数据(往往是网页源码信息)与用户可以看到的信息(往往是页面渲染后的信息)之间,CSS、JS等前端技术发挥了巨大作用。而网页字体渲染,则在网页中最关键的信息源——文字的显示上起到了关键作用。
技术实现思路
本专利技术的技术任务是解决现有技术的不足,从字体渲染的角度尝试对信息数据进行加密,提供一种基于随机字体的网页文本加密与解密方法。本专利技术解决其技术问题所采用的技术方案是:一种基于随机字体的网页文本加密与解密方法,包括步骤如下:步骤S1.提取网页中需要加密的字符集;步骤S2.建立加密字符的映射关系,生成加密映射表cipherbook;步骤S3.创建字体文件;步骤S4.修改字体CMAP表:步骤S5.编辑字形索引glyph_index;步骤S6.将编辑后的字体文件在页面CSS中引用;步骤S7.使用步骤S2定义的加密映射表对网页正文中的内容进行替换;步骤S8.将网页内容及字体返回浏览器即可查看渲染后的页面,此时页面显示字符正常,但复制出来的文本字符是经过加密的文本;步骤S9.在拥有字符映射的情况下,后台可直接使用映射表进行解密。方案优选地,执行步骤S1时,随机在网页文本中选择部分文本字符作为加密字符集,不进行全文加密。方案优选地,执行步骤S2时,将需要加密字符的unicode编码映射到其他字符,其他字符为字体库中不太常用的高位字符,或是毫不相关的字符。方案优选地,步骤2生成的加密映射表cipherbook在后端保存,形式如下:CIPHER_BOOK={'0':'\uE910','1':'\uE911','2':'\uE912','3':'\uE913','4':'\uE914','5':'\uE915','6':'\uE916','7':'\uE917','8':'\uE918','9':'\uE919',}方案优选地,执行步骤S3时,使用已有的字体文件,提取出加密字符集;或者完全自定义包含加密字符集字形的全新字体。方案优选地,执行步骤S4时,按照S2中定义的加密映射关系将cmap映射中的原始字符code替换为加密字符。方案优选地,执行步骤S5时,将字形索引glyph_index进行调整,改成没有明显可读意义的索引名称,字形索引glyph_index对应具体的字形矢量,浏览器解析字形矢量描述绘制在页面渲染绘制文字。方案优选地,步骤S6包括如下步骤:1)首先定义字体:2)然后定义使用该字体的class:.demo-icon{font-family:"fontencode";}3)然后在显示字符的标签中使用该class即可:<h1><smallclass="demo-icon">这是测试文本</small></h1>。本专利技术的一种基于随机字体的网页文本加密与解密方法与现有技术相比所产生的有益效果是:1、本专利技术便从字体渲染的角度尝试对信息数据进行加密,1)字体渲染本身是网页渲染的重要过程,不会对整体样式产生任何影响,保持了样式的统一;2)字体文件仅仅描述了字形的矢量信息,相较图片占用空间很小,字体绘制则完全由浏览器完成,几乎不会对用户体验产生影响;3)经字体加密过后的网页信息,用户可以看到正确信息,而网页源码中的信息则是加密过后的。2、该方法虽无法完全避免爬虫自动化获取信息(如将字体渲染后进行图像识别),但可以极大增加爬虫获取正确信息的成本及数据量,进一步降低了从大量数据中提取关键信息的有效性。综上,本专利可以有效减少网站遭受恶意攻击的风险,同时节省企业在许多无效访问中消耗的大量人力、物力和金钱成本,对于提高产品的用户体验度和满意度具有重要意义。附图说明为了更清楚地描述本专利技术一种基于随机字体的网页文本加密与解密方法的工作原理,下面将附上简图作进一步说明。附图1是本专利技术一种基于随机字体的网页文本加密与解密过程示意图;附图2是本专利技术修改字体CMAP表的示意图;附图3是本专利技术网页字体渲染的示意图。具体实施方式下面将结合本专利技术实施例中的附图1-3,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。目前网络上使用的字体容器格式有四种:EOT、TTF、WOFF等,其中WOFF获得了最广泛的支持。Web开放字体格式(WebOpenFontFormat,简称WOFF)是一种网页所采用的字体格式标准。此字体格式发展于2009年,由万维网联盟的Web字体工作小组标准化,现在已经是推荐标准。此字体格式不但能够有效利用压缩来减少文件大小,并且不包含加密也不受DRM(数字著作权管理)限制。WOFF本质上是包含了基于SFNT的字体(如TrueType、OpenType或其他开放字体格式),且这些字体均经过WOFF的编码工具压缩,以便嵌入网页中。SFNT是一套标准化的字体数据结构格式。许多常见的字体格式都使用其作为容器,提供各个字元标准化的定址表、数据结构等。网页字体是一个字形集合,而每个字形是描述字母或符号的矢量形状。字体渲染过程本质上就是浏览器根据字体文件,为每个文本字符找到对应的矢量形状,然后在页面上将字形本文档来自技高网...

【技术保护点】
1.一种基于随机字体的网页文本加密与解密方法,其特征在于,包括步骤如下:/n步骤S1.提取网页中需要加密的字符集;/n步骤S2.建立加密字符的映射关系,生成加密映射表cipher book;/n步骤S3.创建字体文件;/n步骤S4.修改字体CMAP表:/n步骤S5.编辑字形索引glyph_index;/n步骤S6.将编辑后的字体文件在页面CSS中引用;/n步骤S7.使用步骤S2定义的加密映射表对网页正文中的内容进行替换;/n步骤S8.将网页内容及字体返回浏览器即可查看渲染后的页面,此时页面显示字符正常,但复制出来的文本字符是经过加密的文本;/n步骤S9.在拥有字符映射的情况下,后台可直接使用映射表进行解密。/n

【技术特征摘要】
1.一种基于随机字体的网页文本加密与解密方法,其特征在于,包括步骤如下:
步骤S1.提取网页中需要加密的字符集;
步骤S2.建立加密字符的映射关系,生成加密映射表cipherbook;
步骤S3.创建字体文件;
步骤S4.修改字体CMAP表:
步骤S5.编辑字形索引glyph_index;
步骤S6.将编辑后的字体文件在页面CSS中引用;
步骤S7.使用步骤S2定义的加密映射表对网页正文中的内容进行替换;
步骤S8.将网页内容及字体返回浏览器即可查看渲染后的页面,此时页面显示字符正常,但复制出来的文本字符是经过加密的文本;
步骤S9.在拥有字符映射的情况下,后台可直接使用映射表进行解密。


2.根据权利要求1所述的一种基于随机字体的网页文本加密与解密方法,其特征在于,执行步骤S1时,随机在网页文本中选择部分文本字符作为加密字符集,不进行全文加密。


3.根据权利要求1或2所述的一种基于随机字体的网页文本加密与解密方法,其特征在于,执行步骤S2时,将需要加密字符的unicode编码映射到其他字符,其他字符为字体库中不太常用的高位字符,或是毫不相关的字符。


4.根据权利要求1或2所述的一种基于随机字体的网页文本加密与解密方法,其特征在于,步骤2生成的加密映射表cipherbook在后端保存。


5.根据权利要求1或2所述的一种基于随机字体的网页文本加密与解密方法,其特征在于,执行步骤S3时,使用已有的字体文...

【专利技术属性】
技术研发人员:杨照通杨胜华叶秋萍
申请(专利权)人:浪潮卓数大数据产业发展有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1