数据分片数值确定方法、装置、设备和存储介质制造方法及图纸

技术编号:37392746 阅读:31 留言:0更新日期:2023-04-27 07:30
本申请涉及一种数据分片数值确定方法、装置、计算机设备、存储介质和计算机程序产品。所述方法,可用于金融科技领域或其他相关领域,包括:获取待确定分片数值的分布式数据对应的第一数据特征,以及获取预先得到的多个聚类中心分别对应的多个第二数据特征;多个聚类中心基于多个历史分布式数据得到,各聚类中心分别对应于不同的分片数值;根据第一数据特征,以及多个第二数据特征,从多个聚类中心中,获取与分布式数据相匹配的目标聚类中心;将目标聚类中心对应的目标分片数值,作为分布式数据对应的分片数值。采用本方法能够准确地确定分布式数据的分片数值。式数据的分片数值。式数据的分片数值。

【技术实现步骤摘要】
数据分片数值确定方法、装置、设备和存储介质


[0001]本申请涉及分布式数据
,特别是涉及一种数据分片数值确定方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着分布式数据
的发展,出现了分布式数据的分片数值确定技术,该技术通过工作人员事先基于经验来批量确定分布式数据的分片数值。
[0003]然而,上述技术方案中,工作人员确定分布式数据的分片数值时难免会判断错误,而且批量确定分布式数据的分片数值会使得单个批次分布式数据的分片数值误差较大,上述两个因素均会使得分布式数据的分片数值不准确。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够准确确定分布式数据分片数值的数据分片数值确定方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种数据分片数值确定方法。所述方法包括:
[0006]获取待确定分片数值的分布式数据对应的第一数据特征,以及获取预先得到的多个聚类中心分别对应的多个第二数据特征;所述多个聚类中心本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据分片数值确定方法,其特征在于,所述方法包括:获取待确定分片数值的分布式数据对应的第一数据特征,以及获取预先得到的多个聚类中心分别对应的多个第二数据特征;所述多个聚类中心基于多个历史分布式数据得到,各所述聚类中心分别对应于不同的分片数值;根据所述第一数据特征,以及所述多个第二数据特征,从所述多个聚类中心中,获取与所述分布式数据相匹配的目标聚类中心;将所述目标聚类中心对应的目标分片数值,作为所述分布式数据对应的分片数值。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一数据特征,以及所述多个第二数据特征,从所述多个聚类中心中,获取与所述分布式数据相匹配的目标聚类中心,包括:基于所述第一数据特征,以及所述多个第二数据特征,得到所述分布式数据分别与各所述聚类中心的多个相似度信息;将所述多个相似度信息中,相似度信息最大的聚类中心,作为所述目标聚类中心。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一数据特征,以及所述多个第二数据特征,得到所述分布式数据分别与各所述聚类中心的多个相似度信息,包括:基于所述第一数据特征,得到所述分布式数据对应的第一位置信息;根据所述多个第二数据特征,得到所述多个聚类中心分别对应的多个第二位置信息;利用所述第一位置信息,以及所述多个第二位置信息,得到所述分布式数据分别与各所述聚类中心的多个相似度信息。4.根据权利要求1所述的方法,其特征在于,所述获取预先得到的多个聚类中心分别对应的多个第二数据特征之前,还包括:获取所述多个历史分布式数据,并从所述多个历史分布式数据分别对应的多个分片数值中,获取最大分片数值;从所述多个历史分布式数据中,随机选取所述最大分片数值对应数量的历史分布式数据作为多个初始聚类中心;根据所述多个初始聚类中心,以及所述多个历史分布式数据,对所述多个初始聚类中心进行更新,得到所述多个聚类中心。5.根据权利要求4所述的方法,其特征在于,所述初始聚类中心的更新轮次为多次;所述根据所述多个初始聚类中心,以及所述多个历史分布式数据,对所述多个初始聚类中心进行更新,得到所述多个聚类中心,包括:获取当前更新轮次对应的多个初始聚类中心;基于所述多个历史分布式数据分别到所述多个初始聚类中心的距离,将所述多个历史分布式数据划分至所述多个初始聚类中心所对应的多个聚类集合中,并利用...

【专利技术属性】
技术研发人员:陈知涣黄琼暨光耀连煜伟
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1