【技术实现步骤摘要】
【国外来华专利技术】使用对于自主数据库服务的自适应采样启用高效的机器学习模型推理
[0001]本专利技术涉及数据库管理系统(DBMS)的诸如实时的自优化。本文是用于估计数据库内容统计的自适应即时(just
‑
in
‑
time)采样技术,机器学习(ML)模型可以使用数据库内容统计来预测节省计算机资源(诸如执行时间和存储空间)的配置设置。
技术介绍
[0002]数据库服务的调谐自动化可以依赖于用户数据统计。在生产系统上收集数据统计的成本很高并且会消耗宝贵的计算机资源。现有的数据库引擎使用专门的统计搜集模块来收集并持续维护数据统计,这会降低系统吞吐量。这些模块是有限的,因为统计在需要时并不总是可用的,因此调谐自动化有时不应期望使用这些模块。例如,收集可以被关闭以在高服务器负载期间最小化开销。另一个示例是分析下推引擎的情况。在这种情况下,统计收集被延后,直到数据被卸载到分析引擎中以提高效率。卸载之前统计的不可用性导致使卸载前决策自动化的问题,诸如确定分析集群中计算机和/或数据库实例的数量、最优数据格式、数据压缩和数据 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:重复以下操作,直到满足动态收敛准则:在数据库管理系统(DBMS)中对数据库表的行的子集进行采样,以及基于数据库表的行的所述子集调整数据库表的一个或多个内容统计估计;通过机器学习(ML)模型并基于数据库表的所述一个或多个内容统计估计,预测DBMS的配置设置的最优值;通过DBMS并基于配置设置的最优值,执行访问数据库表的查询。2.如权利要求1所述的方法,还包括基于重复地预测DBMS的配置设置的最优值来满足动态收敛准则。3.如权利要求1所述的方法,还包括基于确切的内容统计来训练ML模型。4.如权利要求3所述的方法,还包括将通过ML模型并基于所述确切的内容统计的第一预测与通过ML模型基于第二内容统计估计的第二预测进行比较。5.如权利要求1所述的方法,其中,所述重复地对数据库表的行的子集进行采样包括对数据库表的行的不相交子集进行采样。6.如权利要求5所述的方法,其中,行的所述不相交子...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。