一种非结构化数据动态抽样存储方法和装置制造方法及图纸

技术编号:43573022 阅读:29 留言:0更新日期:2024-12-06 17:41
本发明专利技术提供了一种非结构化数据动态抽样存储方法及装置,所述方法包括:读取待抽样非结构化数据;计算其总体容量,结合抽样需求,选择抽样算法;由抽样需求得本次抽样的抽样率;计算抽样长度;将读取到的待抽样非结构化数据与抽样长度输入至抽样算法中,得到抽样结果;选择样本加密算法,对抽样结果进行加密,得到加密后的抽样结果;获得抽样数据存储对象,其中,所述抽样数据存储对象包括说明块与数据块两部分;将抽样描述信息存储于抽样数据存储对象的说明块,加密后的抽样结果存储于数据块。达到了抽样结果更客观、抽样效率高,便于首次抽样复现,防止数据被篡改,通过加密算法提高抽样结果和抽样描述信息安全性的技术效果。

【技术实现步骤摘要】

本专利技术涉及数据处理,涉及一种非结构化数据动态抽样存储方法和装置


技术介绍

1、非结构化数据抽样是从非结构化数据集中非连续选择一个子集作为样本,以代表整个数据集的特征和信息。非结构化数据通常指的是没有预定义模式或格式的数据,如文本、图像、音频和视频等。非结构化数据抽样常用的方法有:简单随机抽样、系统抽样、分层抽样、专家抽样、聚类抽样、序列抽样和重要性抽样。

2、但本申请专利技术人在实现本申请实施例中技术方案的过程中,发现上述现有技术至少存在如下技术问题:

3、现有技术中的非结构化数据抽样方法存在抽样规则不具体或不固定,未对抽样描述信息和抽样结果进行加密存储,从而导致首次抽样无法复现,抽样结果和抽样描述信息安全性得不到保证的技术问题。


技术实现思路

1、本专利技术实施例提供了一种非结构化数据动态抽样存储方法和装置,用以解决现有技术中的非结构化数据抽样方法存在抽样规则不具体或不固定,未对抽样描述信息和抽样结果进行加密存储,从而导致首次抽样无法复现,抽样结果和抽样描述信息安全性得不到保证本文档来自技高网...

【技术保护点】

1.一种非结构化数据动态抽样存储方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述将抽样描述信息存储于所述抽样数据存储对象的说明块,包括:

3.如权利要求1所述的方法,其特征在于,所述抽样需求包括:

4.如权利要求3所述的方法,其特征在于,根据所述待抽样非结构化数据的总体容量,结合抽样需求,选择抽样算法,包括:

5.如权利要求4所述的方法,其特征在于,所述根据所述抽样需求,获得本次抽样的抽样率,包括:

6.如权利要求5所述的方法,其特征在于,所述待抽样非结构化数据的总体容量与所述抽样率,计算得到抽样长...

【技术特征摘要】

1.一种非结构化数据动态抽样存储方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述将抽样描述信息存储于所述抽样数据存储对象的说明块,包括:

3.如权利要求1所述的方法,其特征在于,所述抽样需求包括:

4.如权利要求3所述的方法,其特征在于,根据所述待抽样非结构化数据的总体容量,结合抽样需求,选择抽样算法,包括:

5.如权利要求4所述的方法,其特征在于,所述根据所述抽样需求,获得本次抽样的抽样率,包括:...

【专利技术属性】
技术研发人员:吴江王鹏郭静林颖梁漱洋
申请(专利权)人:陕西瀚光数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1