System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及大数据处理,特别是涉及一种申报信息更新方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、根据2013年修订的《国际收支统计申报办法》,在金融机构,例如银行的业务系统进行业务办理时,有义务向监管机构,例如外汇局进行间接申报,而在跨境业务申报过程中,存在根据业务处理内容填写合适的涉外收支业务编码的问题,需要对涉外收支业务进行分类,并设置对应的业务编码。
2、在目前的实践中,判断业务内容分属哪一业务类型,属于何种业务编码所辖范围等主要都依赖于人工判断,容易出现分类错误的情况,为了避免由于分类错误而受到相应惩罚,需要对业务的申报信息进行检查,对分类错误的情况进行更新,以降低错误申报信息的报送次数,提高申报信息的报送准确性。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够对申报信息中的分类错误情况进行更新,提高申报信息报送准确性的申报信息更新方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种申报信息更新方法,所述方法包括:
3、获取申报机构针对待申报业务的申报信息;所述申报信息包括业务描述信息和业务编码;
4、根据所述业务描述信息所描述的业务内容,对所述业务描述信息进行特征转换,得到所述业务描述信息对应的业务描述特征;
5、基于所述业务描述特征分别与多个候选申报编码的匹配度,从各所述候选申报编码中确定所述待申报业务的申报编码;
6、在所述
7、在其中一个实施例中,所述根据所述业务描述信息所描述的业务内容,对所述业务描述信息进行特征转换,得到所述业务描述信息对应的业务描述特征,包括:
8、调用特征转换模型对所述业务描述信息进行特征转换,得到所述业务描述信息对应的业务描述特征;
9、训练得到所述特征转换模型的过程包括:
10、获取所述申报机构已申报完成的历史申报数据;所述历史申报数据中包括多个历史申报编码各自对应的历史业务描述信息;
11、基于包含所述历史业务描述信息的训练样本对预训练模型进行微调,得到特征转换模型。
12、在其中一个实施例中,所述历史申报编码包括样本数量满足小样本条件的特定编码、以及样本数量满足大样本条件的非特定编码;
13、所述方法还包括:
14、获取各所述特定编码和各所述非特定编码各自对应的业务类型信息;
15、针对每一所述特定编码,根据各所述业务类型信息所表征的业务层级关系,从各所述非特定编码中,确定与所述特定编码匹配的目标非特定编码;
16、融合所述特定编码和所述目标非特定编码各自的历史业务描述信息,得到所述特定编码的训练样本。
17、在其中一个实施例中,所述基于包含各所述历史业务描述信息的训练样本对预训练模型进行微调,得到特征转换模型,包括:
18、分别将所述训练样本中所述特定编码的历史业务描述信息和所述目标非特定编码的历史业务描述信息输入预训练模型中进行转换,得到所述特定编码的特定描述特征和所述目标非特定编码的非特定描述特征;
19、确定所述特定描述特征和所述非特定描述特征之间的特征距离;
20、根据所述特征距离对所述预训练模型进行微调,得到特征转换模型。
21、在其中一个实施例中,所述根据所述特征距离对所述预训练模型进行微调,得到特征转换模型,包括:
22、在所述特征距离不满足微调结束条件的情况下,对所述预训练模型进行微调,得到微调模型;
23、将所述微调模型作为预训练模型,返回分别将所述训练样本中所述特定编码的历史业务描述信息和所述目标非特定编码的历史业务描述信息输入预训练模型中进行转换,确定特征距离的步骤;
24、在所述特征距离满足所述微调结束条件的情况下,得到特征转换模型。
25、在其中一个实施例中,所述基于所述业务描述特征分别与多个候选申报编码的匹配度,从各所述候选申报编码中确定所述待申报业务的申报编码,包括:
26、调用分类模型确定业务描述特征分别与多个候选申报编码的匹配度,从各所述候选申报编码中确定所述待申报业务的申报编码;所述分类模型根据所述申报机构的历史申报数据训练得到。
27、在其中一个实施例中,训练得到所述分类模型的过程包括:
28、获取所述申报机构已申报完成的历史申报数据;所述历史申报数据中包括多个历史申报编码,以及各所述历史申报编码各自对应的历史业务描述信息;
29、根据各所述历史业务描述信息所描述的业务内容,对各所述历史业务描述信息进行特征转换,得到各所述历史业务描述信息各自对应的历史业务描述特征;
30、将各所述历史业务描述特征分别与各自对应的历史申报编码进行绑定后,得到所述分类模型的训练样本数据集;
31、基于所述训练样本数据集对所述分类模型的初始分类模型进行模型训练,得到所述分类模型。
32、第二方面,本申请还提供了一种申报信息更新装置,所述装置包括:
33、信息获取模块,用于获取申报机构针对待申报业务的申报信息;所述申报信息包括业务描述信息和业务编码;
34、特征转换模块,用于根据所述业务描述信息所描述的业务内容,对所述业务描述信息进行特征转换,得到所述业务描述信息对应的业务描述特征;
35、申报编码确定模块,用于基于所述业务描述特征分别与多个候选申报编码的匹配度,从各所述候选申报编码中确定所述待申报业务的申报编码;
36、更新模块,用于在所述业务编码与所述申报编码满足更新条件的情况下,将所述业务编码替换为所述申报编码,得到所述待申报业务的更新申报信息。
37、第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
38、第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
39、第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
40、上述申报信息更新方法、装置、计算机设备、存储介质和计算机程序产品,在获取到待申报业务的申报信息后,可以根据申报信息中的业务描述信息所描述的业务内容,对业务描述信息进行特征转换,得到业务描述信息对应的业务描述特征,业务描述特征可以准确的描述待申报业务的业务内容,随后确定业务描述特征分别与多个候选申报编码的匹配度,根据匹配度从各候选申报编码中确定与待申报业务的业务内容最匹配的申报编码,将申报编码与待申报业务申报信息中自己填写的业务编码进行比较,在业务编码和申本文档来自技高网...
【技术保护点】
1.一种申报信息更新方法,包括:
2.权利要求1所述的方法,其特征在于,根据所述业务描述信息所描述的业务内容,对所述业务描述信息进行特征转换,得到所述业务描述信息对应的业务描述特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述历史申报编码包括样本数量满足小样本条件的特定编码、以及样本数量满足大样本条件的非特定编码;
4.根据权利要求3所述的方法,得到包含各所述历史业务描述信息的训练样本,基于此训练样本对预训练模型进行微调,得到特征转换模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述特征距离对所述预训练模型进行微调,得到特征转换模型,包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述业务描述特征分别与多个候选申报编码的匹配度,从各所述候选申报编码中确定所述待申报业务的申报编码,包括:
7.根据权利要求6所述的方法,其特征在于,训练得到所述分类模型的过程包括:
8.一种申报信息更新装置,其特征在于,所述装置包括:
9.根据权利要求8所述的
10.根据权利要求9所述的装置,其特征在于,所述历史申报编码包括样本数量满足小样本条件的特定编码、以及样本数量满足大样本条件的非特定编码;所述装置还包括:
11.根据权利要求10所述的装置,其特征在于,所述模型微调单元包括:
12.根据权利要求11所述的方法,其特征在于,所述模型微调子单元具体用于:
13.根据权利要求8-12任一项所述的装置,其特征在于,所述申报编码确定模块包括:
14.权利要求13所述的装置还包括:
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
17.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种申报信息更新方法,包括:
2.权利要求1所述的方法,其特征在于,根据所述业务描述信息所描述的业务内容,对所述业务描述信息进行特征转换,得到所述业务描述信息对应的业务描述特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述历史申报编码包括样本数量满足小样本条件的特定编码、以及样本数量满足大样本条件的非特定编码;
4.根据权利要求3所述的方法,得到包含各所述历史业务描述信息的训练样本,基于此训练样本对预训练模型进行微调,得到特征转换模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述特征距离对所述预训练模型进行微调,得到特征转换模型,包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述业务描述特征分别与多个候选申报编码的匹配度,从各所述候选申报编码中确定所述待申报业务的申报编码,包括:
7.根据权利要求6所述的方法,其特征在于,训练得到所述分类模型的过程包括:
8.一种申报信息更新装置,其特征在于,所述装置包括:
9.根据权利要求8...
【专利技术属性】
技术研发人员:黄正,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。