字段取值的确定方法、装置和电子设备制造方法及图纸

技术编号:38414977 阅读:9 留言:0更新日期:2023-08-07 11:18
本申请公开了一种字段取值的确定方法、装置和电子设备。涉及金融科技领域,该方法包括:获取与N个存量文件分别对应的N组存量字段组,以及与目标文件对应的目标字段组,其中,N为大于1的整数;在N组存量字段组中,确定与目标字段组的相似度符合预定条件的字段组为相似字段组;获取与相似字段组对应的相似取值组;根据相似字段组和相似取值组,确定与目标字段组对应的目标取值组。通过本申请,解决了相关技术中登记文件结构信息或文件传输信息中字段对应的字段取值效率低的技术问题。对应的字段取值效率低的技术问题。对应的字段取值效率低的技术问题。

【技术实现步骤摘要】
字段取值的确定方法、装置和电子设备


[0001]本专利技术涉及金融科技领域,具体而言,涉及一种字段取值的确定方法、装置和电子设备。需要说明的是,本专利技术确定的字段取值的确定方法、装置和电子设备可用于金融科技领域中确定字段的取值,也可用于除金融科技领域之外的任意领域中确定字段的取值,本专利技术涉及的字段取值的确定方法、装置和电子设备的应用领域不做限定。

技术介绍

[0002]开发人员在传输新增文件时,需要登记文件结构信息、文件传输信息等,也即填写字段名对应的字段取值。比如:登记主机文件接口时,需要登记copybook信息,也即文件结构信息,必填字段信息有域名、域名描述、数据类型及数据长度。其中,域名、数据类型及数据长度主要由开发人员根据copybook文件依次填写,或者编写程序读copybook文件生成相应的字段取值,但域名描述一般需要根据经验或者查找存量数据来填写。登记文件结构信息后,还需要登记文件传输信息,文件传输信息中的译码信息需要判断相应字段的译码类型,译码类型也只能根据经验值或者存量数据来判断。
[0003]目前开发人员登记文件结构信息和文件传输信息时,主要存在效率低等问题。若人工来确定字段取值,当文件结构信息较多时,需要花费较长的时间来确定相应的字段取值。
[0004]针对相关技术中登记文件结构信息或文件传输信息中字段对应的字段取值效率低的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种字段取值的确定方法、装置和电子设备,以至少解决登记文件结构信息或文件传输信息中字段对应的字段取值效率低的技术问题。
[0006]为了实现上述目的,根据本申请的一个方面,提供了一种字段取值的确定方法。该方法包括:获取与N个存量文件分别对应的N组存量字段组,以及与目标文件对应的目标字段组,其中,N为大于1的整数;在N组存量字段组中,确定与目标字段组的相似度符合预定条件的字段组为相似字段组;获取与相似字段组对应的相似取值组;根据相似字段组和相似取值组,确定与目标字段组对应的目标取值组。
[0007]可选地,在N组存量字段组中,确定与目标字段组的相似度符合预定条件的字段组为相似字段组,包括:将N组存量字段组划分为M个聚类,其中,M为大于1的整数;将M个聚类排序,得到聚类序列;按照聚类序列,依次在M个聚类中确定与目标字段组的相似度符合预定条件的字段组为相似字段组。
[0008]可选地,将M个聚类排序,得到聚类序列,包括:确定与M个聚类分别对应的M个簇心;分别确定目标字段组与M个簇心的相似度;按照目标字段组与M个簇心的相似度,将M个聚类排序,得到聚类序列。
[0009]可选地,按照聚类序列,依次在M个聚类中确定与目标字段组的相似度符合预定条
件的字段组为相似字段组,包括:在聚类序列为按照目标字段组与M个簇心的相似度降序排列的情况下,确定聚类序列中排在首位的聚类为目标聚类;确定目标聚类包括的存量字段组与目标字段组的相似度;将目标聚类中与目标字段组的相似度大于预定阈值的存量字段组为相似字段组;依次在M个聚类中确定与目标字段组的相似度大于预定阈值的存量字段组为相似字段组,直到目标字段组包括的字段在相似字段组中均存在匹配的字段,或,依次在M个聚类中确定与目标字段组的相似度大于预定阈值的存量字段组为相似字段组,直到相似字段组包括M个聚类中与目标字段组的相似度大于预定阈值的字段组。
[0010]可选地,还包括:在相似字段组包括M个聚类中与目标字段组的相似度大于预定阈值的字段组,且目标字段组中存在与相似字段组中的字段不匹配的字段情况下,确定目标字段组中与相似字段组中的字段不匹配的字段;显示目标字段组和不匹配的字段。
[0011]可选地,根据相似字段组和相似取值组,确定与目标字段组对应的目标取值组,包括:在相似字段组为L组的情况下,分别确定L组相似字段组与目标字段组的相似度,其中,L为大于1的整数;根据L组相似字段组与目标字段组的相似度,将L组相似字段组排序,得到字段组序列;按照字段组序列,依次根据L组相似字段组分别对应的L组相似取值组,确定目标取值组。
[0012]可选地,按照字段组序列,依次根据L组相似字段组分别对应的L组相似取值组,确定目标取值组,包括:在字段组序列为按照L组相似字段组与目标字段组的相似度降序排列的情况下,确定字段组序列中排在首位的字段组为第一相似字段组;将第一相似字段组与目标字段组匹配,确定第一相似字段组中匹配的字段为第一字段,并确定目标字段组中匹配的字段为第二字段;确定第二字段对应的取值为第一字段对应的取值,其中,目标取值组包括第二字段对应的取值;确定字段组序列中排在目标相似字段组下一位的字段组为第二相似字段组;将第二相似字段组与目标字段组中未匹配的字段匹配,并确定未匹配的字段中与第二相似字段组中的字段匹配的字段的取值,其中,目标取值组包括与第二相似字段组中的字段匹配的字段的取值;依次根据L组相似字段组对应的相似取值组,确定目标取值组。
[0013]为了实现上述目的,根据本申请的另一方面,提供了一种字段取值的确定装置。该装置包括:第一获取模块,用于获取与N个存量文件分别对应的N组存量字段组,以及与目标文件对应的目标字段组,其中,N为大于1的整数;第一确定模块,用于在N组存量字段组中,确定与目标字段组的相似度符合预定条件的字段组为相似字段组;第二获取模块,用于获取与相似字段组对应的相似取值组;第二确定模块,用于根据相似字段组和相似取值组,确定与目标字段组对应的目标取值组。
[0014]为了实现上述目的,根据本申请的另一方面,提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备上述中任意一项的字段取值的确定方法。
[0015]为了实现上述目的,根据本申请的另一方面,提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述中任意一项的字段取值的确定方法。
[0016]通过本申请,采用以下步骤:获取与N个存量文件分别对应的N组存量字段组,以及与目标文件对应的目标字段组,其中,N为大于1的整数;在N组存量字段组中,确定与目标字
段组的相似度符合预定条件的字段组为相似字段组;获取与相似字段组对应的相似取值组;根据相似字段组和相似取值组,确定与目标字段组对应的目标取值组,达到了根据存量文件与目标文件的字段的相似度确定字段取值的目的,解决了相关技术中登记文件结构信息或文件传输信息中字段对应的字段取值效率低的技术问题,进而达到了提高登记文件结构信息或文件传输信息中字段对应的字段取值效率的技术效果。
附图说明
[0017]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0018]图1是根据本申请实施例提供的字段取值的确定方法的流程图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字段取值的确定方法,其特征在于,包括:获取与N个存量文件分别对应的N组存量字段组,以及与目标文件对应的目标字段组,其中,N为大于1的整数;在所述N组存量字段组中,确定与所述目标字段组的相似度符合预定条件的字段组为相似字段组;获取与所述相似字段组对应的相似取值组;根据所述相似字段组和所述相似取值组,确定与所述目标字段组对应的目标取值组。2.根据权利要求1所述的方法,其特征在于,所述在所述N组存量字段组中,确定与所述目标字段组的相似度符合预定条件的字段组为相似字段组,包括:将所述N组存量字段组划分为M个聚类,其中,M为大于1的整数;将所述M个聚类排序,得到聚类序列;按照所述聚类序列,依次在所述M个聚类中确定与所述目标字段组的相似度符合预定条件的字段组为所述相似字段组。3.根据权利要求2所述的方法,其特征在于,所述将所述M个聚类排序,得到聚类序列,包括:确定与所述M个聚类分别对应的M个簇心;分别确定所述目标字段组与所述M个簇心的相似度;按照所述目标字段组与所述M个簇心的相似度,将所述M个聚类排序,得到所述聚类序列。4.根据权利要求3所述的方法,其特征在于,所述按照所述聚类序列,依次在所述M个聚类中确定与所述目标字段组的相似度符合预定条件的字段组为所述相似字段组,包括:在所述聚类序列为按照所述目标字段组与所述M个簇心的相似度降序排列的情况下,确定所述聚类序列中排在首位的聚类为目标聚类;确定所述目标聚类包括的存量字段组与所述目标字段组的相似度;将所述目标聚类中与所述目标字段组的相似度大于预定阈值的存量字段组为所述相似字段组;依次在所述M个聚类中确定与所述目标字段组的相似度大于所述预定阈值的存量字段组为所述相似字段组,直到所述目标字段组包括的字段在所述相似字段组中均存在匹配的字段,或,依次在所述M个聚类中确定与所述目标字段组的相似度大于所述预定阈值的存量字段组为所述相似字段组,直到所述相似字段组包括所述M个聚类中与所述目标字段组的相似度大于所述预定阈值的字段组。5.根据权利要求4所述的方法,其特征在于,还包括:在所述相似字段组包括所述M个聚类中与所述目标字段组的相似度大于所述预定阈值的存量字段组,且所述目标字段组中存在与所述相似字段组中的字段不匹配的字段情况下,确定所述目标字段组中与所述相似字段组中的字段不匹配的字段;显示所述目标字段组和所述不匹配的字段。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述根据所述相似字...

【专利技术属性】
技术研发人员:袁玉洁段秋梅江昌林段锴
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1