The invention provides an automatic recommendation method, device, device and readable storage medium for data storage rules, including: extracting multiple data tables in data warehouse in response to data optimization storage request; obtaining storage rules configured by users for each data table; re storing the multiple data tables according to the storage rules as the data table to be optimized; obtaining the data table to be optimized The attributes of the data table; according to the attributes of the data table to be optimized, a plurality of optimized storage schemes of the data table to be optimized are determined; the storage efficiency of each optimized storage scheme is calculated; the optimized storage scheme with the highest storage efficiency is recommended to the user as the optimal storage scheme. It solves the problem of low efficiency and high labor cost in selecting optimization scheme based on the existing technology and human experience.
【技术实现步骤摘要】
一种数据存储规则自动推荐方法、装置、设备及可读存储介质
本专利技术涉及网页设计
,特别是涉及一种数据存储规则自动推荐方法、装置、设备及可读存储介质。
技术介绍
随着大数据存储模式的兴起,大数据在云平台上根据科学有效的配置进行存储是必须面对的紧要问题。首先,用户需要了解大数据的存储方式,再根据不同的需求使用最优化的方案进行再存储,以便高效利用资源和高效的输出数据。现有技术中,大部分数据优化方案都是基于人工经验进行选取,费时费力且成本过高,另一种方案是根据候选参数的排名提取重要候选参数集;根据候选参数生成训练数据库并建立预测模型;提取出目标应用程序的负载特征;根据预测模型对所述目标应用程序的负载特征进行处理,生成并输出优化配置参数及各优化配置参数的取值。该方法针对不同应用进行不同配置,缺少统一标准,效率无法保证,可行性和收益预估不准确。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据存储规则自动推荐方法、装置、设备及可读存储 ...
【技术保护点】
1.一种数据存储规则自动推荐方法,其特征在于,包括:/n响应于数据优化存储请求,提取数据仓库中多个数据表;/n获取用户针对各所述数据表配置的存储规则;/n根据所述存储规则重新存储所述多个数据表为待优化数据表;/n获取所述待优化数据表的属性;/n根据所述待优化数据表的属性,确定所述待优化数据表的多个可优化存储方案;/n计算各所述可优化存储方案的存储效益;/n将所述存储效益最高的所述可优化存储方案作为最优存储方案,推荐给所述用户。/n
【技术特征摘要】
1.一种数据存储规则自动推荐方法,其特征在于,包括:
响应于数据优化存储请求,提取数据仓库中多个数据表;
获取用户针对各所述数据表配置的存储规则;
根据所述存储规则重新存储所述多个数据表为待优化数据表;
获取所述待优化数据表的属性;
根据所述待优化数据表的属性,确定所述待优化数据表的多个可优化存储方案;
计算各所述可优化存储方案的存储效益;
将所述存储效益最高的所述可优化存储方案作为最优存储方案,推荐给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述根据所述存储规则重新存储所述多个数据表为待优化数据表,包括:
根据所述存储规则提取各所述数据表中对应的元数据;
将所述元数据重新存储为待优化数据表。
3.根据权利要求2所述的方法,其特征在于,所述将所述元数据重新存储为待优化数据表,包括:
提取所述元数据的元数据指标;所述元数据指标包括分区热度存储、字段重复记录存储、表间字段冗余存储、文件大小存储中的一种或多种;
将所述元数据按照所述分区热度存储,和/或所述字段重复记录存储,和/或所述表间字段冗余存储,和/或所述文件大小存储为待优化快照表,或待优化全量表,或待优化增量表。
4.根据权利要求3所述的方法,其特征在于,所述获取所述待优化数据表的属性,包括:
根据所述元数据指标,确定所述待优化数据表的表属性;所述表属性包括快照表,或全量表,或增量表。
5.根据权利要求4所述的方法,其特征在于,所述根据所述待优化数据表的属性,确定所述待优化数据表的多个可优化存储方案,包括:
在预设指标方案对应关系列表中为所述待优化快照表,或所述待优化全量表,或所述待优化增量表选择可优化分区归档方案,或可优化压缩存储方案、或可优化模型优化方案中的一种或多种。
6.根据权利要求4...
【专利技术属性】
技术研发人员:安云杰,魏建钟,刘强,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。