【技术实现步骤摘要】
本专利技术涉及数据存储,尤其涉及一种基于信息熵和区块链的非结构化数据存储优化方法及系统。
技术介绍
1、非结构化数据包括图像、视频、文本、音频等多种形式,传统的数据存储系统在处理大量非结构化数据时面临着存储效率低、安全性差、管理复杂等问题,区块链技术的分布式、不可篡改、可追溯等特性为非结构化数据的存储提供了新的思路和方法;
2、然而,现有的非结构化数据存储技术存在难以有效识别和处理非结构化数据中的冗余信息,导致大量重复或相似数据被重复存储,不仅浪费存储资源,还增加了数据管理的复杂性、在数据分布和访问优化方面缺乏有效机制,无法根据数据访问频次和特性进行智能分配,导致热点数据访问拥塞和资源利用不均衡,降低了整个存储系统的性能和响应速度以及难以保证非结构化数据在分布式环境中的安全性和可靠性,特别是缺乏高效的数据访问验证和完整性证明方法,使系统面临数据篡改和未授权访问的风险等问题。
技术实现思路
1、本专利技术实施例提供一种基于信息熵和区块链的非结构化数据存储优化方法及系统,至少能解决
...【技术保护点】
1.基于信息熵和区块链的非结构化数据存储优化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,建立区块链存储网络并获取非结构化数据,构建非结构化数据对应的协方差矩阵并进行特征值分解,得到降维数据包括:
3.根据权利要求1所述的方法,其特征在于,通过预设的核函数将降维数据映射至高维特征空间,构建最优分类超平面,计算每个降维数据到所述最优分类超平面的距离向量得到初始冗余数据集,基于初始冗余数据集中的数据特征生成二进制编码序列,对所述二进制编码序列执行选择、交叉和变异运算得到优化特征序列包括:
4.根据权利要求1所述的方
...【技术特征摘要】
1.基于信息熵和区块链的非结构化数据存储优化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,建立区块链存储网络并获取非结构化数据,构建非结构化数据对应的协方差矩阵并进行特征值分解,得到降维数据包括:
3.根据权利要求1所述的方法,其特征在于,通过预设的核函数将降维数据映射至高维特征空间,构建最优分类超平面,计算每个降维数据到所述最优分类超平面的距离向量得到初始冗余数据集,基于初始冗余数据集中的数据特征生成二进制编码序列,对所述二进制编码序列执行选择、交叉和变异运算得到优化特征序列包括:
4.根据权利要求1所述的方法,其特征在于,根据所述优化特征序列标记冗余数据,计算不同冗余数据的模糊相似度,剔除模糊相似度大于预设模糊相似度阈值的数据,得到待存储数据集包括:
5.根据权利要求1所述的方法,其特征在于,对所述待存储数据集按照预设大小进行分块得到数据...
【专利技术属性】
技术研发人员:高海玲,穆强,
申请(专利权)人:北京科杰科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。