一种基于UTF-32编码的数据混淆方法及装置制造方法及图纸

技术编号:29758777 阅读:23 留言:0更新日期:2021-08-20 21:12
本发明专利技术提供了一种基于UTF‑32编码的数据混淆方法及装置。所述方法包括获取UTF‑32码元序列;判断所述UTF‑32码元序列中每个字节的有效性;如果所述UTF‑32码元序列中同时存在有效字节和无效字节,则对所述UTF‑32码元序列中的无效字节进行混淆,得到混淆数据。以此方式,可以对UTF‑32的数据进行混淆加密,大大降低对系统负载的影响,提高系统效率;降低了系统复杂度,对系统性能要求低;隐蔽性强且易于实现。

【技术实现步骤摘要】
一种基于UTF-32编码的数据混淆方法及装置
本专利技术一般涉及计算机
,并且更具体地,涉及一种基于UTF-32编码的数据混淆方法及装置。
技术介绍
在低性能平台中,为了保证传输效率,往往会对信息进行加密处理。对于文本信息而言,最常使用的是UTF编码,其中UTF-32是最经常使用的消息格式之一。UTF-32是一种将Unicode字符编码的协定,对每一个Unicode码位使用恰好32位元。UTF-32具有对计算性能要求低且长度提前可知的优点,被广泛应用于文本编码中。在UTF-32的应用过程中,往往需要对数据进行混淆加密,但由于UTF-32本身长度就是UTF-8的1.5倍左右,如果使用常规的加密算法,例如密码学中的高级加密标准(AdvancedEncryptionStandard,AES)、RSA加密算法等,当消息数量过大时,往往会对系统负载产生较大的负载影响。
技术实现思路
根据本专利技术的实施例,提供了一种基于UTF-32编码的数据混淆方案。在本专利技术的第一方面,提供了一种基于UTF-32编码的数据混淆方法。该方法包括:获取UTF-32码元序列;判断所述UTF-32码元序列中每个字节的有效性;如果所述UTF-32码元序列中同时存在有效字节和无效字节,则对所述UTF-32码元序列中的无效字节进行混淆,得到混淆数据。进一步地,所述判断所述UTF-32码元序列中每个字节的有效性,包括:如果一个字节的首位二进制值为0,剩余7位二进制值为随机值,则该字节为有效字节;如果一个字节的每位二进制值均为0,则该字节为无效字节。进一步地,所述对所述UTF-32码元序列中的无效字节进行混淆,包括:获取所述UTF-32码元序列中的无效字节;将所述无效字节的首位二进制值替换为1,并将所述无效字节的剩余7位二进制值替换为随机值。进一步地,所述随机值为0或1。在本专利技术的第二方面,提供了一种基于UTF-32编码的混淆数据还原方法。该方法包括:获取UTF-32编码的混淆数据;识别所述UTF-32编码的混淆数据中的混淆无效字节;将所述混淆无效字节还原为无效字节,得到还原后的UTF-32码元序列。进一步地,所述识别所述UTF-32编码的混淆数据中的混淆无效字节,包括:如果所述UTF-32编码的混淆数据中字节的首位二进制值为1,则该字节为混淆无效字节;如果所述UTF-32编码的混淆数据中字节的首位二进制值不为1,则该字节为有效字节。进一步地,所述将所述混淆无效字节还原为无效字节,包括:将所述混淆无效字节中每位二进制值全部替换为0。在本专利技术的第三方面,提供了一种基于UTF-32编码的数据混淆装置。该装置包括:获取模块,用于获取UTF-32编码的数据;判断模块,用于判断所述UTF-32编码的数据中同时是否存在有效字节和无效字节;混淆模块,用于当所述UTF-32编码的数据中同时存在有效字节和无效字节时,对所述UTF-32编码的数据进行混淆,得到UTF-32编码的混淆数据。在本专利技术的第四方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上第一方面或第二方面所述的方法。在本专利技术的第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本专利技术的第一方面或第二方面的方法。本专利技术通过对UTF-32编码的数据进行混淆,大大降低对系统负载的影响,提高系统效率;降低了系统复杂度,对系统性能要求低;并且通过对混淆后数据进行还原,得到原始基于UTF-32编码的数据;整个方法隐蔽性强且易于实现。附图说明结合附图并参考以下详细说明,本专利技术各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了根据本专利技术的实施例的基于UTF-32编码的数据混淆方法的流程图;图2示出了根据本专利技术的实施例的基于UTF-32编码的混淆数据还原方法的流程图;图3示出了根据本专利技术的实施例的基于UTF-32编码的数据混淆装置的方框图;图4示出了根据本专利技术的实施例的基于UTF-32编码的混淆数据还原装置的方框图;图5示出了能够实施本专利技术的实施例的示例性电子设备的方框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本专利技术保护的范围。另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。本专利技术中,能够通过简单的混淆加密过程,对UTF-32的数据进行混淆加密,大大降低对系统负载的影响,提高系统效率;降低了系统复杂度,对系统性能要求低;隐蔽性强且易于实现。图1示出了本专利技术实施例的基于UTF-32编码的数据混淆方法的流程图。该方法包括:S101、获取UTF-32码元序列。UTF-32是由ISO10646标准定义了一个32位元的编码形式,也称作UCS-4,使用通用字符集(UCS)的每一个字符,会在0到十六进制的0x7fffffff的字码空间中,被表示成一个的32位元的码值,可以用于表示所有的语言中的文字和符号。在本专利技术的实施例中,首先需要获取到UTF-32编码的数据,即码元序列作为数据混淆的基础。S102、判断所述UTF-32码元序列中每个字节的有效性,即判断所述UTF-32码元序列中是否同时存在有效字节和无效字节。根据UTF-32的编码原理,其固定使用4个字长的编码。作为本专利技术的一种实施例,在固定的4个字长的编码中,如果一个字节的首位二进制值为0,剩余7位二进制值为随机值,则该字节为有效字节。所述UTF-32码元序列中有效字节表示为0xxxxxxx;其中二进制值为0的为有效字节的首位,剩余7位“x”表示二进制值为随机值。所述随机值为0或1。作为本专利技术的一种实施例,在固定的4个字长的编码中,如果一个字节的每位二进制值均为0,则该字节为无效字节。所述UTF-32码元序列中无效字节表示为00000000。判断所述UTF-32码元序列中是否同时存在有效字节和无效字节,可以分别判断所述UTF-32码元序列中是否存在有效字节和无效字节。如果所述UTF-32码元序列中的4个字节中,至少有一个字节的首位二进制值为0,剩余7位二进制值为随机值,则可以判定该字节为有效字节,即本文档来自技高网...

【技术保护点】
1.一种基于UTF-32编码的数据混淆方法,其特征在于,包括:/n获取UTF-32码元序列;/n判断所述UTF-32码元序列中每个字节的有效性;/n如果所述UTF-32码元序列中同时存在有效字节和无效字节,则对所述UTF-32码元序列中的无效字节进行混淆,得到混淆数据。/n

【技术特征摘要】
1.一种基于UTF-32编码的数据混淆方法,其特征在于,包括:
获取UTF-32码元序列;
判断所述UTF-32码元序列中每个字节的有效性;
如果所述UTF-32码元序列中同时存在有效字节和无效字节,则对所述UTF-32码元序列中的无效字节进行混淆,得到混淆数据。


2.根据权利要求1所述的方法,其特征在于,所述判断所述UTF-32码元序列中每个字节的有效性,包括:
如果一个字节的首位二进制值为0,剩余7位二进制值为随机值,则该字节为有效字节;
如果一个字节的每位二进制值均为0,则该字节为无效字节。


3.根据权利要求1所述的方法,其特征在于,所述对所述UTF-32码元序列中的无效字节进行混淆,包括:
获取所述UTF-32码元序列中的无效字节;
将所述无效字节的首位二进制值替换为1,并将所述无效字节的剩余7位二进制值替换为随机值。


4.根据权利要求2或3所述的方法,其特征在于,所述随机值为0或1。


5.一种基于UTF-32编码的混淆数据还原方法,其特征在于,包括:
获取UTF-32编码的混淆数据;
识别所述UTF-32编码的混淆数据中的混淆无效字节;
将所述混淆无效字节还原为无效字节,得到还原后...

【专利技术属性】
技术研发人员:郝伟刘加瑞白兴伟沈传宝
申请(专利权)人:北京华云安信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1