【技术实现步骤摘要】
数据表分区方法、装置、计算机可读介质及电子设备
[0001]本申请属于数据库管理
,具体涉及一种数据表分区方法、数据表分区装置、计算机可读介质以及电子设备。
技术介绍
[0002]近年来,随着互联网的高速发展,企业应用越来越复杂,数据库中的数据表越来越宽,数据量越来越大,且数据增速也越来越快。数据库中几T容量的数据表数不胜数。
[0003]而目前对于数据表的分区判断一般通过人工根据经验来判断,或者根据简单的预设条件进行分区操作,利用这两种方法都将导致数据表分区判断不准确,使得很多不该分区的数据表分区,导致数据字典过大,影响系统性能;而对于应该进行分区而未分区的数据表,对数据表的增删改操作响应时间会越来越慢,备份恢复耗时长,一定程度上对数据库带来了可扩展性、可维护性、可靠性和稳定性方面的压力。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0005]本申请的目的在于提供一种 ...
【技术保护点】
【技术特征摘要】
1.一种数据表分区方法,其特征在于,包括:获取数据表的当前响应时间和特征参数,所述当前响应时间包括结构化查询语言对所述数据表进行增删改所需的时间;将所述数据表的特征参数输入预训练的时间预测模型中,得到所述数据表分区后的预测响应时间,所述时间预测模型是以分区后的数据表样本为输入,以分区后的数据表样本对应的响应时间为输出,进行机器学习训练的模型;计算所述数据表的当前响应时间与所述数据表分区后的预测响应时间之间的响应时间差;若所述响应时间差大于预设的时间阈值,则按所述数据表的属性对所述数据表进行分区。2.根据权利要求1所述的数据表分区方法,其特征在于,将所述数据表的特征参数输入预训练的时间预测模型中,得到所述数据表分区后的预测响应时间,包括:通过预训练的时间预测模型,得到最佳权重值,所述最佳权重值用于根据所述数据表的特征参数计算所述数据表分区后的预测响应时间;将所述最佳权重值代入预测时间计算公式中,得到所述数据表分区后的预测响应时间,所述预测时间计算公式如下:其中,y表示数据表分区后的预测响应时间,x1表示数据表所在服务器的中央处理器的处理频率,x2表示数据表所在服务器的内存量,x3表示数据表所在服务器的缓存量,x4表示数据表物理量,x5表示数据表数据量,x6表示数据表的宽度,x7表示数据表的分区数量,x8表示数据表的数据增长量,x9表示数据表的保存周期,x
10
表示数据表的物理读数:x
11
表示数据表的逻辑读数,a0‑
a
k
表示权重值。3.根据权利要求2所述的数据表分区方法,其特征在于,通过预训练的时间预测模型,得到最佳权重值,包括:将数据分区后的k个数据表和对应数据表样本的响应时间组合,形成训练数据表集;将所述训练数据表集中的k
‑
1个数据表作为训练集,将另外一个数据表作为测试集,基于所述训练集来预测测试集的响应时间,并与所述测试集的实际响应时间进行对比,得到权重值误差;重复进行k次训练,得到k个权重值误差,根据所述k个权重值误差的平均值计算得出最佳权重值。4.根据权利要求3所述的数据表分区方法,其特征在于,在根据所述k个权重值误差的平均值计算得出最佳权重值之后,所述方法还包括:使用P值假定方法确定所述最佳...
【专利技术属性】
技术研发人员:何昕,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。