一种多模型数据库OrientDB参数配置自动调优方法技术

技术编号:26845466 阅读:19 留言:0更新日期:2020-12-25 13:07
本发明专利技术涉及一种多模型数据库OrientDB参数配置自动调优方法,包括:在默认参数配置下使用MMBench对OrientDB进行基准测试,使用OSMonitor得到OrientDB的初始运行状态s,使用OPIndicator得到OrientDB的性能p;在状态s,调优模型输出参数配置a;将OrientDB参数配置调整为a后,使用MMBench对OrientDB进行基准测试,OSMonitor对OrientDB的运行状态进行实时监控和处理得到状态指标s′,OPIndicator统计OrientDB的性能变化,根据奖励函数计算得到奖励r;将训练数据四元组(s,a,r,s′)存入调优经验池;从调优经验池中随机采样数量为m的小批量样本用以训练调优模型;如果调优模型收敛或达到人为设置的终止条件则结束训练得到预训练调优模型;在实际工作负载下使用预训练调优模型输出推荐的参数配置。

【技术实现步骤摘要】
一种多模型数据库OrientDB参数配置自动调优方法
本专利技术属于数据库
,更具体地,涉及一种基于深度强化学习的多模型数据库OrientDB参数配置自动调优方法。
技术介绍
多模型数据库是近年来数据库领域里一个新的研究方向。OrientDB作为一种新兴的多模型数据库,存在参数配置优化的问题,一方面,默认的参数配置并不能使其达到最佳性能,需要针对实际应用负载对其参数配置进行调优;另一方面,现有的单模型数据库上的参数配置调优经验无法直接迁移到OrientDB上。为了降低参数配置调优难度,提高OrientDB性能,充分发挥其潜能,亟需研究OrientDB参数配置自动调优技术。文献“AutomaticDatabaseManagementSystemTuningThroughLarge-scaleMachineLearning(SIGMOD2017)”提出了OtterTune,将机器学习技术运用到数据库参数配置自动调优中。OtterTune将工作负载特征化,利用历史调优经验数据训练机器学习模型,它首先使用Lasso算法选择出对系统性能影响最大的参数配置,然后将待处理的工作负载与已有的进行匹配,最后使用高斯过程回归算法对选择出来参数配置进行调优。然而,上述数据库参数配置调优方法存在着不可忽略的问题:OtterTune在训练调优模型时,需要大量高质量的数据库管理员(DatabaseAdministrator,DBA)调优历史经验数据作为训练样本,但这些高质量的训练样本通常是很难获得的。专利技术内容本专利技术的目的在于提供一种多模型数据库OrientDB参数配置自动调优方法,用于解决现有基于机器学习的数据库参数配置调优方法无法在缺乏DBA调优历史经验数据的情况下正常工作的问题。本专利技术一种多模型数据库OrientDB参数配置自动调优方法,其中,包括:在默认参数配置下使用MMBench对OrientDB进行基准测试,使用OSMonitor得到OrientDB的初始运行状态s,使用OPIndicator得到OrientDB的性能p;在状态s,调优模型输出参数配置a;将OrientDB参数配置调整为a后,使用MMBench对OrientDB进行基准测试,OSMonitor对OrientDB的运行状态进行实时监控和处理得到状态指标s′,OPIndicator统计OrientDB的性能变化,根据奖励函数计算得到奖励r;将训练数据四元组(s,a,r,s′)存入调优经验池;从调优经验池中随机采样数量为m的小批量样本用以训练调优模型;如果调优模型收敛或达到人为设置的终止条件则结束训练得到预训练调优模型,否则,令s←s′,反回在状态s,调优模型输出参数配置a的步骤;在实际工作负载下使用预训练调优模型输出推荐的参数配置,调优系统与用户的OrientDB交互k次,在这k次交互的过程中调优系统对预训练调优模型的网络参数进行微调,以适应实际工作负载,取这k次中OrientDB性能最优时对应的参数配置作为调优模型推荐的参数配置。根据本专利技术所述的多模型数据库OrientDB参数配置自动调优方法的一实施例,其中,基于DDPG算法构建调优模型,DDPG算法包含行动者和评论家两个部分,行动者部分采用当前行动者网络和目标行动者网络,评论家部分采用当前评论家网络和目标评论家网络,在调优模型中,随机初始化当前行动者网络的参数θμ和当前评论家网络的参数θQ,初始化目标行动者网络的参数θμ′和目标评论家网络的参数θQ′,其中θμ′=θμ,θQ′=θQ,初始化调优经验池,容量为M。根据本专利技术所述的多模型数据库OrientDB参数配置自动调优方法的一实施例,基于DDPG算法构建调优模型,DDPG算法包含行动者和评论家两个部分,行动者部分采用当前行动者网络和目标行动者网络,评论家部分采用当前评论家网络和目标评论家网络,在调优模型中,随机初始化当前行动者网络的参数θμ和当前评论家网络的参数θQ,初始化目标行动者网络的参数θμ′和目标评论家网络的参数θQ′,其中θμ′=θμ,θQ′=θQ,初始化调优经验池,容量为M。根据本专利技术所述的多模型数据库OrientDB参数配置自动调优方法的一实施例,其中,用(si,ai,ri,s'i)表示单个样本,计算当前评论家网络的梯度;采用评论家网络优化器更新当前评论家网络的参数;计算当前行动者网络的策略梯度;采用行动者网络优化器更新当前行动者网络的参数;更新目标行动者网络和目标评论家网络的参数。根据本专利技术所述的多模型数据库OrientDB参数配置自动调优方法的一实施例,其中,根据奖励函数计算得到奖励r:其中,ΔPt→0表示相对于默认参数配置下OrientDB性能的提升率,表示相对于OrientDB历史最优性能的提升率;ΔPt→0>0表示当前性能相对于默认参数配置下OrientDB性能有所提升,ΔPt→0<0表示当前性能相对于默认参数配置下OrientDB性能有所下降,表示当前性能相对于OrientDB历史最优性能有所提升,表示当前性能相对于OrientDB历史最优性能有所下降。根据本专利技术所述的多模型数据库OrientDB参数配置自动调优方法的一实施例,其中,a=μ(s|θμ)。根据本专利技术所述的多模型数据库OrientDB参数配置自动调优方法的一实施例,其中,a=μ(s|θμ),μ是利用当前行动者网络逼近的策略函数。根据本专利技术所述的多模型数据库OrientDB参数配置自动调优方法的一实施例,计算当前评论家网络的梯度:其中yi为目标Q值,由目标评论家网络计算得到:yi=ri+γQ′(si′,μ′(si′|θμ′)|θQ′);采用评论家网络优化器更新当前评论家网络的参数θQ;计算行动者网络的策略梯度:采用行动者网络优化器更新当前行动者网络的参数θμ;更新目标行动者网络和目标评论家网络的参数:其中,τ为软更新系数。根据本专利技术所述的多模型数据库OrientDB参数配置自动调优方法的一实施例,其中,在实际工作负载下使用预训练调优模型输出推荐的参数配置,包括:S21、使用基准测试工具MMBench重放当前实际工作负载,对OrientDB进行性能测试;在MMBench对OrientDB进行性能测试期间,使用OSMonitor得到OrientDB的初始运行状态,使用OPIndicator得到OrientDB在默认参数配置下的性能;S22、使用预训练调优模型为OrientDB输出推荐的参数配置,在在与用户的OrientDB进行交互的过程中对预训练调优模型的网络参数进行微调,以适应实际工作负载;S23、重复n次步骤S22,取这n次中OrientDB性能最优时对应的参数配置作为调优模型推荐的最终参数配置,将OrientDB参数配置调整为本专利技术的一种基于深度强化学习的多模型数据库OrientDB参数配置自动调优方法,基于深度强化学习算法构建OrientDB参数配置调优模型,设计了一个有效的奖励函数用以指导调优模本文档来自技高网...

【技术保护点】
1.一种多模型数据库OrientDB参数配置自动调优方法,其特征在于,包括:/n在默认参数配置下使用MMBench对OrientDB进行基准测试,使用OSMonitor得到OrientDB的初始运行状态s,使用OPIndicator得到OrientDB的性能p;在状态s,调优模型输出参数配置a;/n将OrientDB参数配置调整为a后,使用MMBench对OrientDB进行基准测试,OSMonitor对OrientDB的运行状态进行实时监控和处理得到状态指标s′,OPIndicator统计OrientDB的性能变化,根据奖励函数计算得到奖励r;/n将训练数据四元组(s,a,r,s′)存入调优经验池;/n从调优经验池中随机采样数量为m的小批量样本用以训练调优模型;/n如果调优模型收敛或达到人为设置的终止条件则结束训练得到预训练调优模型,否则,令s←s′,反回在状态s,调优模型输出参数配置a的步骤;/n在实际工作负载下使用预训练调优模型输出推荐的参数配置,调优系统与用户的OrientDB交互k次,在这k次交互的过程中调优系统对预训练调优模型的网络参数进行微调,以适应实际工作负载,取这k次中OrientDB性能最优时对应的参数配置...

【技术特征摘要】
1.一种多模型数据库OrientDB参数配置自动调优方法,其特征在于,包括:
在默认参数配置下使用MMBench对OrientDB进行基准测试,使用OSMonitor得到OrientDB的初始运行状态s,使用OPIndicator得到OrientDB的性能p;在状态s,调优模型输出参数配置a;
将OrientDB参数配置调整为a后,使用MMBench对OrientDB进行基准测试,OSMonitor对OrientDB的运行状态进行实时监控和处理得到状态指标s′,OPIndicator统计OrientDB的性能变化,根据奖励函数计算得到奖励r;
将训练数据四元组(s,a,r,s′)存入调优经验池;
从调优经验池中随机采样数量为m的小批量样本用以训练调优模型;
如果调优模型收敛或达到人为设置的终止条件则结束训练得到预训练调优模型,否则,令s←s′,反回在状态s,调优模型输出参数配置a的步骤;
在实际工作负载下使用预训练调优模型输出推荐的参数配置,调优系统与用户的OrientDB交互k次,在这k次交互的过程中调优系统对预训练调优模型的网络参数进行微调,以适应实际工作负载,取这k次中OrientDB性能最优时对应的参数配置作为调优模型推荐的参数配置。


2.如权利要求1所述的多模型数据库OrientDB参数配置自动调优方法,其特征在于,
基于DDPG算法构建调优模型,DDPG算法包含行动者和评论家两个部分,行动者部分采用当前行动者网络和目标行动者网络,评论家部分采用当前评论家网络和目标评论家网络,在调优模型中,随机初始化当前行动者网络的参数θμ和当前评论家网络的参数θQ,初始化目标行动者网络的参数θμ′和目标评论家网络的参数θQ′,其中θμ′=θμ,θQ′=θQ,初始化调优经验池,容量为M。


3.如权利要求1所述的多模型数据库OrientDB参数配置自动调优方法,其特征在于,用(si,ai,ri,s'i)表示单个样本,计算当前评论家网络的梯度;采用评论家网络优化器更新当前评论家网络的参数;计算当前行动者网络的策略梯度;采用行动者网络优化器更新当前行动者网络的参数;更新目标行动者网络和目标评论家网络的参数。


4.如权利要求1所述的多模型数据库OrientDB参数配置自动调优方法,其特征在于,根据奖励函数计算得到奖励r:

...

【专利技术属性】
技术研发人员:牛中盈冉忞玮王冲周可宋时青李春花胡琦王仁冯帆
申请(专利权)人:北京计算机技术及应用研究所航天科工网络信息发展有限公司华中科技大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1