一种大数据量随机比特序列重码统计和定位的方法和系统技术方案

技术编号：39865010 阅读：8 留言：0更新日期：2023-12-30 12:56

一种大数据量随机比特序列重码统计和定位的方法和系统，方法包括待测随机比特序列获取；测试系统初始化；样本提取和分治存储；样本存储集合内重码查找；重码精确定位和长度拓展；大数据量随机比特序列重码统计和定位系统包括数据输入模块

全部详细技术资料下载

【技术实现步骤摘要】
一种大数据量随机比特序列重码统计和定位的方法和系统

[0001]本专利技术涉及大数据
，特别涉及一种大数据量随机比特序列重码统计和定位的方法和系统
。

技术介绍

[0002]随着量子信息技术的不断创新和发展，以及相关行业商业化程度不断提高
。
使用量子随机过程作为熵源的随机数发生器在随机序列输出速率和质量上都有明显的进步
。
在输出速率方面，当前一些国产厂商已经能够实现
600Mbps
网口输出速率，能够支持相当多的应用环境
。
而对于随机数序列质量，通常要求要通过
《GM/T 0005
‑
2021 随机数检测规范
》
中定义的检测项
。
随机比特序列中存在的重码序列的统计个数在一定程度上能够描述原始随机数序列的质量
。
对于大数据量的原始随机比特序列，如
10GB
，通常规定要统计的重码的长度范围在
64
比特到
80
比特之间
。
仅看
10GB
随机比特序列内部包含的
64
比特重码的情况，其样本量大小为
85,899,345,857。
这种数据量当前大多数计算机无法直接进行分析和处理
。
在大数据量查重方面，通常采用
Bitmap
来映射样本集合，然后根据映射过程中的出现的重复映射结果统计重码结果
。
...

【技术保护点】

【技术特征摘要】
1.
一种大数据量随机比特序列重码统计和定位的方法，其特征在于，包括以下步骤：待测随机比特序列获取，获取待检测的随机比特序列；测试系统初始化，确定测试规模，设置处理参数，获取并构建随机比特序列的初始样本，调整初始样本字节序列；样本提取和分治存储，提取随机比特序列中包含的所有样本，并根据预设分治存储条件，将样本存储到不同的样本存储集合；样本存储集合内重码查找，获取样本存储集合内的所有样本并进行重码检测，将重码样本输出到重码对集合；重码精确定位和长度拓展，遍历重码对集合，计算重码元素在随机比特序列中的精准位置，获取重码完整长度，并根据位置信息剔除重复统计的重码；完成大数据量随机比特序列重码统计和定位
。2.
如权利要求1所述的大数据量随机比特序列重码统计和定位的方法，其特征在于，测试系统初始化过程中，所述初始样本构建为一个样本数据结构，包含样本序列和样本位置信息，样本序列由
64
比特的随机比特子序列填充
。3.
如权利要求1所述的大数据量随机比特序列重码统计和定位的方法，其特征在于，样本序列根据主机字节序列调整为合适的存储顺序，样本位置信息由扇区号和段号组成，扇区号和段号的划分根据实际检测的随机比特序列数据量决定
。4.
如权利要求1所述的大数据量随机比特序列重码统计和定位的方法，其特征在于，样本提取和分治存储过程中，提取随机比特序列中的样本通过基础位操作结合当前处理位置比特信息对前一样本进行更新，并调整样本位置信息，所述预设分治存储条件，根据随机比特...

【专利技术属性】
技术研发人员：赵嘉程，周琛，
申请(专利权)人：浙江九州量子信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人