【技术实现步骤摘要】
一种多模型数据库OrientDB参数配置自动调优方法
本专利技术属于数据库
,更具体地,涉及一种基于深度强化学习的多模型数据库OrientDB参数配置自动调优方法。
技术介绍
多模型数据库是近年来数据库领域里一个新的研究方向。OrientDB作为一种新兴的多模型数据库,存在参数配置优化的问题,一方面,默认的参数配置并不能使其达到最佳性能,需要针对实际应用负载对其参数配置进行调优;另一方面,现有的单模型数据库上的参数配置调优经验无法直接迁移到OrientDB上。为了降低参数配置调优难度,提高OrientDB性能,充分发挥其潜能,亟需研究OrientDB参数配置自动调优技术。文献“AutomaticDatabaseManagementSystemTuningThroughLarge-scaleMachineLearning(SIGMOD2017)”提出了OtterTune,将机器学习技术运用到数据库参数配置自动调优中。OtterTune将工作负载特征化,利用历史调优经验数据训练机器学习模型,它首先使用Lasso算法选择出对系统性能影响最大的参数配置,然后将待处理的工作负载与已有的进行匹配,最后使用高斯过程回归算法对选择出来参数配置进行调优。然而,上述数据库参数配置调优方法存在着不可忽略的问题:OtterTune在训练调优模型时,需要大量高质量的数据库管理员(DatabaseAdministrator,DBA)调优历史经验数据作为训练样本,但这些高质量的训练样本通常是很难获得的。专利技 ...
【技术保护点】
1.一种多模型数据库OrientDB参数配置自动调优方法,其特征在于,包括:/n在默认参数配置下使用MMBench对OrientDB进行基准测试,使用OSMonitor得到OrientDB的初始运行状态s,使用OPIndicator得到OrientDB的性能p;在状态s,调优模型输出参数配置a;/n将OrientDB参数配置调整为a后,使用MMBench对OrientDB进行基准测试,OSMonitor对OrientDB的运行状态进行实时监控和处理得到状态指标s′,OPIndicator统计OrientDB的性能变化,根据奖励函数计算得到奖励r;/n将训练数据四元组(s,a,r,s′)存入调优经验池;/n从调优经验池中随机采样数量为m的小批量样本用以训练调优模型;/n如果调优模型收敛或达到人为设置的终止条件则结束训练得到预训练调优模型,否则,令s←s′,反回在状态s,调优模型输出参数配置a的步骤;/n在实际工作负载下使用预训练调优模型输出推荐的参数配置,调优系统与用户的OrientDB交互k次,在这k次交互的过程中调优系统对预训练调优模型的网络参数进行微调,以适应实际工作负载,取这k次 ...
【技术特征摘要】
1.一种多模型数据库OrientDB参数配置自动调优方法,其特征在于,包括:
在默认参数配置下使用MMBench对OrientDB进行基准测试,使用OSMonitor得到OrientDB的初始运行状态s,使用OPIndicator得到OrientDB的性能p;在状态s,调优模型输出参数配置a;
将OrientDB参数配置调整为a后,使用MMBench对OrientDB进行基准测试,OSMonitor对OrientDB的运行状态进行实时监控和处理得到状态指标s′,OPIndicator统计OrientDB的性能变化,根据奖励函数计算得到奖励r;
将训练数据四元组(s,a,r,s′)存入调优经验池;
从调优经验池中随机采样数量为m的小批量样本用以训练调优模型;
如果调优模型收敛或达到人为设置的终止条件则结束训练得到预训练调优模型,否则,令s←s′,反回在状态s,调优模型输出参数配置a的步骤;
在实际工作负载下使用预训练调优模型输出推荐的参数配置,调优系统与用户的OrientDB交互k次,在这k次交互的过程中调优系统对预训练调优模型的网络参数进行微调,以适应实际工作负载,取这k次中OrientDB性能最优时对应的参数配置作为调优模型推荐的参数配置。
2.如权利要求1所述的多模型数据库OrientDB参数配置自动调优方法,其特征在于,
基于DDPG算法构建调优模型,DDPG算法包含行动者和评论家两个部分,行动者部分采用当前行动者网络和目标行动者网络,评论家部分采用当前评论家网络和目标评论家网络,在调优模型中,随机初始化当前行动者网络的参数θμ和当前评论家网络的参数θQ,初始化目标行动者网络的参数θμ′和目标评论家网络的参数θQ′,其中θμ′=θμ,θQ′=θQ,初始化调优经验池,容量为M。
3.如权利要求1所述的多模型数据库OrientDB参数配置自动调优方法,其特征在于,用(si,ai,ri,s'i)表示单个样本,计算当前评论家网络的梯度;采用评论家网络优化器更新当前评论家网络的参数;计算当前行动者网络的策略梯度;采用行动者网络优化器更新当前行动者网络的参数;更新目标行动者网络和目标评论家网络的参数。
4.如权利要求1所述的多模型数据库OrientDB参数配置自动调优方法,其特征在于,根据奖励函数计算得到奖励r:
...
【专利技术属性】
技术研发人员:牛中盈,冉忞玮,王冲,周可,宋时青,李春花,胡琦,王仁,冯帆,
申请(专利权)人:北京计算机技术及应用研究所,航天科工网络信息发展有限公司,华中科技大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。