一种面向键值对存储引擎的参数自动调优方法、装置、系统制造方法及图纸

技术编号：21891709 阅读：19 留言：0更新日期：2019-08-17 14:26

本发明专利技术公开了一种面向键值对存储引擎的参数自动调优方法、装置、系统，能够解决键值对存储系统中因工作负载发生变化导致默认的参数配置引起系统性能下降的问题。所述方法包括：依据键值对存储引擎中的参数配置方式，对参数进行预处理，并构建Restful服务化框架；构建基于模型的Deep PILCO强化学习模型；运行上层数据库系统的工作负载，生成数据，训练模型；载入模型，针对输入的工作负载，输出策略产生的参数配置，应用到底层键值对存储引擎中。本发明专利技术应用于以日志结构合并树作为存储引擎的数据库系统、工作负载经常变化的场景中。

An Automatic Parameter Tuning Method, Device and System for Key Value Pair Storage Engine

全部详细技术资料下载

【技术实现步骤摘要】
一种面向键值对存储引擎的参数自动调优方法、装置、系统
本专利技术属于存储
，具体涉及一种面向键值对存储引擎的参数自动调优方法。
技术介绍
随着云计算和大数据技术的不断发展和普及，数据存储量呈现出爆炸式增长的趋势。根据IDC在2019年的预测，全球在2019-2023年预测期内的存储机容量将翻倍，增长到11.7ZB，大规模存储的需求日益强烈。随着大规模分布式存储技术的发展，对传统关系型数据库的改造研究成为热点，出现了诸多以RocksDB作为存储引擎的新型数据库系统。RocksDB是一种基于日志结构合并树的键值对系统，它具有化随机I/O为顺序I/O的优点，大大优化了数据写入的性能，在提高吞吐量和减少时延方面方面有着巨大的优势，是当前大规模数据存储的首选产品。以RocksDB为存储引擎的系统目前主要有关系型数据库MySQL、新型数据库TiDB、分布式文件系统Ceph以及区块链系统以太坊Parity分支等，如此大范围的应用说明在底层优化键值对存储引擎具有很高的直接经济效益。然而，在动态变化的工作负载场景中，默认的参数配置不能发挥最佳的存储性能，对这些参数进行调优是一个挑战。RocksDB中的存储参数众多，它们之间的依赖关系复杂，即使同一个参数在不同的工作负载下也有不同的性能表现，并且这些参数在复杂多变的工作负载下缺乏自适应性，在极端情况下会导致写停止等严重的性能问题。这些存在的问题阻碍了键值对存储引擎的进一步应用。
技术实现思路
专利技术目的：针对现有技术的缺陷与不足，本专利技术提出一种面向键值对存储引擎的参数自动调优方法、装置和系统，能够有效地应对在默认参数配...

【技术保护点】
1.一种面向键值对存储引擎的参数自动调优方法，其特征在于，所述方法包括以下步骤：依据键值对存储引擎中的参数配置方式，对参数进行预处理，并构建Restful服务化框架；构建基于模型的Deep PILCO强化学习模型；运行上层数据库系统的工作负载，生成数据，训练模型；载入模型，针对输入的工作负载输出策略产生的参数配置，应用到底层键值对存储引擎中。

【技术特征摘要】
1.一种面向键值对存储引擎的参数自动调优方法，其特征在于，所述方法包括以下步骤：依据键值对存储引擎中的参数配置方式，对参数进行预处理，并构建Restful服务化框架；构建基于模型的DeepPILCO强化学习模型；运行上层数据库系统的工作负载，生成数据，训练模型；载入模型，针对输入的工作负载输出策略产生的参数配置，应用到底层键值对存储引擎中。2.根据权利要求1所述的一种面向键值对存储引擎的参数自动调优方法，其特征在于，所述依据键值对存储引擎中的参数配置方式，对参数进行预处理包括：收集键值对存储引擎中分别通过SetDBOption、SetOption和ReadOption配置的三类参数；对三类参数提取最小值、最大值和默认值，并设置调参步长。3.根据权利要求1所述的一种面向键值对存储引擎的参数自动调优方法，其特征在于，所述Restful服务化框架为为客户端-服务器端模式，客户端为存储引擎，服务器端为自动调参模块，客户端使用后台线程保持与自动调参模块的交互，完成向服务器发送和请求数据的任务；服务器端进行模型训练和提供基于RestfulAPI的模型在线服务。4.根据权利要求1所述的一种面向键值对存储引擎的参数自动调优方法，其特征在于，所述构建基于模型的DeepPILCO强化学习模型包括：以系统状态和数据库状态作为强化学习的环境输入，以系统吞吐量作为奖励，以调节的参数作为动作；构建策略模型，用来选择动作，策略包括随机策略、线性策略和神经网络策略，其中随机策略是在待调参数的动作空间中随机选择一个作为动作，线性策略是在状态空间中通过一个线性函数映射到动作空间，神经网络策略是基于多层感知器将状态空间的值映射到动作空间；构建动力学模型，用来学习数据库的状态转移模型，所述动力学模型是一个BNN神经网络，其数据输入方法包括数据缓冲区和粒子采样；构建训练流程，设置模型训练参数和损失函数。5.根据权利要求4所述的一种面向键值对存储引擎的参数自动调优方法，其特征在于，所述以系统吞吐量作...

【专利技术属性】
技术研发人员：骆克云，唐斌，叶保留，陆桑璐，王剑，钱琳，
申请(专利权)人：南京大学，国网浙江省电力有限公司，南瑞集团有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人