【技术实现步骤摘要】
本专利技术涉及数据处理,涉及一种非结构化数据动态抽样存储方法和装置。
技术介绍
1、非结构化数据抽样是从非结构化数据集中非连续选择一个子集作为样本,以代表整个数据集的特征和信息。非结构化数据通常指的是没有预定义模式或格式的数据,如文本、图像、音频和视频等。非结构化数据抽样常用的方法有:简单随机抽样、系统抽样、分层抽样、专家抽样、聚类抽样、序列抽样和重要性抽样。
2、但本申请专利技术人在实现本申请实施例中技术方案的过程中,发现上述现有技术至少存在如下技术问题:
3、现有技术中的非结构化数据抽样方法存在抽样规则不具体或不固定,未对抽样描述信息和抽样结果进行加密存储,从而导致首次抽样无法复现,抽样结果和抽样描述信息安全性得不到保证的技术问题。
技术实现思路
1、本专利技术实施例提供了一种非结构化数据动态抽样存储方法和装置,用以解决现有技术中的非结构化数据抽样方法存在抽样规则不具体或不固定,未对抽样描述信息和抽样结果进行加密存储,从而导致首次抽样无法复现,抽样结果和抽样描述
...【技术保护点】
1.一种非结构化数据动态抽样存储方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述将抽样描述信息存储于所述抽样数据存储对象的说明块,包括:
3.如权利要求1所述的方法,其特征在于,所述抽样需求包括:
4.如权利要求3所述的方法,其特征在于,根据所述待抽样非结构化数据的总体容量,结合抽样需求,选择抽样算法,包括:
5.如权利要求4所述的方法,其特征在于,所述根据所述抽样需求,获得本次抽样的抽样率,包括:
6.如权利要求5所述的方法,其特征在于,所述待抽样非结构化数据的总体容量与所述抽
...【技术特征摘要】
1.一种非结构化数据动态抽样存储方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述将抽样描述信息存储于所述抽样数据存储对象的说明块,包括:
3.如权利要求1所述的方法,其特征在于,所述抽样需求包括:
4.如权利要求3所述的方法,其特征在于,根据所述待抽样非结构化数据的总体容量,结合抽样需求,选择抽样算法,包括:
5.如权利要求4所述的方法,其特征在于,所述根据所述抽样需求,获得本次抽样的抽样率,包括:...
【专利技术属性】
技术研发人员:吴江,王鹏,郭静,林颖,梁漱洋,
申请(专利权)人:陕西瀚光数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。