一种数据处理方法技术

技术编号：39491764 阅读：8 留言：0更新日期：2023-11-24 11:14

本申请公开了一种数据处理方法

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置、电子设备及存储介质

[0001]本申请涉及大数据领域，尤其涉及一种数据处理方法
、
装置
、
电子设备及存储介质
。

技术介绍

[0002]随着数字化
、
网络化
、
智能化的高速发展，各类型数据正以几何级数增长
。
在相关技术中，通常会使用多种数据架构对数据进行存储
。
[0003]但是，数据往往会在不同的数据架构下重复存储，例如数据可能在大规模并行分析数据库存储，也可能在分布式文件系统数据库重复存储，从而导致数据冗余度较高，进而使得存储资源占用率较高
。

技术实现思路

[0004]有鉴于此，本申请提供了一种数据处理方法
、
装置
、
电子设备及存储介质，旨在降低存储资源占用率
。
[0005]第一方面，本申请提供了一种数据处理方法，所述方法包括：
[0006]获取待存储的数据表，所述待存储的数据表包括多个字段；
[0007]从历史字段存储概率表中，分别获取所述多个字段中每个字段在数据架构中的存储概率值；
[0008]基于所述每个字段在数据架构中的存储概率值，利用朴素贝叶斯分类算法，计算所述待存储的数据表在数据架构中的存储概率值；
[0009]根据所述待存储的数据表在数据架构中的存储概率值，确定所述待存储的数据表存储的数据架构
。
[0010]可选地，所述历史字段存储概率...

【技术保护点】

【技术特征摘要】
1.
一种数据处理方法，其特征在于，所述方法包括：获取待存储的数据表，所述待存储的数据表包括多个字段；从历史字段存储概率表中，分别获取所述多个字段中每个字段在数据架构中的存储概率值；基于所述每个字段在数据架构中的存储概率值，利用朴素贝叶斯分类算法，计算所述待存储的数据表在数据架构中的存储概率值；根据所述待存储的数据表在数据架构中的存储概率值，确定所述待存储的数据表存储的数据架构
。2.
根据权利要求1所述的方法，其特征在于，所述历史字段存储概率表，是通过如下方式生成的：获取历史数据，所述历史数据包括多个历史字段；计算所述多个历史字段中每个历史字段在数据架构中的历史存储概率值；将所述历史存储概率值存入所述历史字段存储概率表中
。3.
根据权利要求1所述的方法，其特征在于，所述数据架构包括大规模并行分析数据库和分布式文件系统数据库
。4.
根据权利要求3所述的方法，其特征在于，所述基于所述每个字段在数据架构中的存储概率值，利用朴素贝叶斯分类算法，计算所述待存储的数据表在数据架构中的存储概率值，包括：基于所述每个字段在大规模并行分析数据库中的存储概率值，利用朴素贝叶斯分类算法，计算所述待存储的数据表在大规模并行分析数据库中的存储概率值；基于所述每个字段在分布式文件系统数据库中的存储概率值，利用朴素贝叶斯分类算法，计算所述待存储的数据表在分布式文件系统数据库中的存储概率值
。5.
根据权利要求4所述的方法，其特征在于，所述根据所述待存储的数据表在数据架构中的存储概率值，确定所述待存储的数据表存储的数据架构，包括：...

【专利技术属性】
技术研发人员：宋雨，
申请(专利权)人：中国银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人