System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,特别是一种数据的校准方法、系统及介质。
技术介绍
1、监管机构要求商业银行和各类金融公司对每日所产生的大额以及可疑交易按照一定的报文格式进行报送。在报送后,监管机构会对报文中的每一个字段进行校验,对于不符合要求的报文发出错误以及补正回执,要求金融机构进行数据的补正。现有技术中,为提高报文的通过率,会在提交报文之前自行对所需报送的数据进行校准,以避免数据中存在错误信息。但是,现有技术中的校准速率较慢。因此,如何提高数据的校准效率,成为当前所需解决的技术问题。
技术实现思路
1、鉴于上述问题,本专利技术的目的在于提供一种数据的校准方法、系统及介质,以提高数据的校准效率,具体方案如下:
2、第一方面,本申请实施例公开了一种数据的校准方法,所述校准方法包括:
3、获取待识别数据;
4、将所述待识别数据输入至预设分类模型中,得到所述待识别数据的分类标签;所述分类标签用于表示所述待识别数据中是否存在错误信息,以及所述错误信息的类别;
5、若所述分类标签为所述待识别数据中不存在错误信息,则输出所述待识别数据;
6、若所述分类标签为所述待识别数据中存在错误信息,则根据所述待识别数据的分类标签,从预设校准库中选择目标文本纠错模型;所述预设校准库中包括多个文本纠错模型;所述目标文本纠错模型,用于对具有所述分类标签的待识别数据进行校准;
7、将所述待识别数据输入至所述目标文本纠错模型中,得到校准数据。
9、对所述待识别数据进行预处理,得到所述待识别数据中各个字段的特征数据;
10、将所述待识别数据中各个字段的特征输入至所述预设分类模型中,得到所述待识别数据中各个字段的分类标签;
11、对所述待识别数据中各个字段的分类标签进行汇总,得到所述待识别数据的分类标签。
12、可选的,所述对所述待识别数据进行预处理,得到所述待识别数据中各个字段的特征数据,包括:
13、对所述待识别数据进行分词,得到所述待识别数据包含的各个字段;
14、对所述待识别数据包含的各个字段进行向量化,得到多个词向量;
15、对所述多个词向量进行特征提取,得到所述待识别数据中各个字段的特征数据。
16、可选的,所述根据所述待识别数据的分类标签,从预设校准库中选择目标文本纠错模型,包括:
17、当所述待识别数据包括多个分类标签时,根据所述多个分类标签,从所述预设校准库中选择多个目标文本纠错模型;所述多个目标文本纠错模型与所述多个分类标签一一对应。
18、可选的,所述获取待识别数据包括:
19、获取当日交易数据;
20、对所述当日交易数据进行风险行为识别,得到待识别交易数据;所述待识别交易数据为涉及风险行为的当日交易数据;
21、获取所述待识别交易数据的用户信息;
22、将所述用户信息和所述待识别交易数据,作为所述待识别数据。
23、第二方面,本申请实施例公开了一种数据的校准系统,所述校准系统包括:
24、获取模块,用于获取待识别数据;
25、分类模块,用于将所述待识别数据输入至预设分类模型中,得到所述待识别数据的分类标签;所述分类标签用于表示所述待识别数据中是否存在错误信息,以及所述错误信息的类别;
26、输出模块,用于若所述分类标签为所述待识别数据中不存在错误信息,则输出所述待识别数据;
27、选择模块,用于若所述分类标签为所述待识别数据中存在错误信息,则根据所述待识别数据的分类标签,从预设校准库中选择目标文本纠错模型;所述预设校准库中包括多个文本纠错模型;所述目标文本纠错模型,用于对具有所述分类标签的待识别数据进行校准;
28、校准模块,用于将所述待识别数据输入至所述目标文本纠错模型中,得到校准数据。
29、可选的,所述分类模块,包括:
30、预处理单元,用于对所述待识别数据进行预处理,得到所述待识别数据中各个字段的特征数据;
31、分类单元,用于将所述待识别数据中各个字段的特征输入至所述预设分类模型中,得到所述待识别数据中各个字段的分类标签;
32、汇总单元,用于对所述待识别数据中各个字段的分类标签进行汇总,得到所述待识别数据的分类标签。
33、可选的,所述预处理单元具体用于:
34、对所述待识别数据进行分词,得到所述待识别数据包含的各个字段;
35、对所述待识别数据包含的各个字段进行向量化,得到多个词向量;
36、对所述多个词向量进行特征提取,得到所述待识别数据中各个字段的特征数据。
37、可选的,所述获取模块包括:
38、获取单元,用于获取当日交易数据;
39、识别单元,用于对所述当日交易数据进行风险行为识别,得到待识别交易数据;所述待识别交易数据为涉及风险行为的当日交易数据;
40、获取单元还用于,获取所述待识别交易数据的用户信息;将所述用户信息和所述待识别交易数据,作为所述待识别数据。
41、第三方面,本申请实施例公开了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任意一种数据的校准方法。
42、相对于现有技术,本申请具有以下有益效果:
43、通过获取待识别数据,将待识别数据输入至预设分类模型中,得到待识别数据的分类标签。若分类标签为待识别数据中不存在错误信息,则输出待识别数据。若分类标签为待识别数据中存在错误信息,则根据待识别数据的分类标签,从预设校准库中选择目标文本纠错模型。将待识别数据输入至目标文本纠错模型中,得到校准数据。由于分类标签用于表示待识别数据中是否存在错误信息,以及错误信息的类别,从而通过自动对待识别数据进行打标,以及采用与标签对应的目标文本纠错模型对错误信息进行校准,提高数据的校准效率。
本文档来自技高网...【技术保护点】
1.一种数据的校准方法,其特征在于,所述校准方法包括:
2.根据权利要求1所述的校准方法,其特征在于,所述将所述待识别数据输入至预设分类模型中,得到所述待识别数据的分类标签,包括:
3.根据权利要求2所述的校准方法,其特征在于,所述对所述待识别数据进行预处理,得到所述待识别数据中各个字段的特征数据,包括:
4.根据权利要求1所述的校准方法,其特征在于,所述根据所述待识别数据的分类标签,从预设校准库中选择目标文本纠错模型,包括:
5.根据权利要求1所述的校准方法,其特征在于,所述获取待识别数据包括:
6.一种数据的校准系统,其特征在于,所述校准系统包括:
7.根据权利要求6所述的校准系统,其特征在于,所述分类模块,包括:
8.根据权利要求7所述的校准系统,其特征在于,所述预处理单元具体用于:
9.根据权利要求6所述的校准系统,其特征在于,所述获取模块包括:
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至5中
...【技术特征摘要】
1.一种数据的校准方法,其特征在于,所述校准方法包括:
2.根据权利要求1所述的校准方法,其特征在于,所述将所述待识别数据输入至预设分类模型中,得到所述待识别数据的分类标签,包括:
3.根据权利要求2所述的校准方法,其特征在于,所述对所述待识别数据进行预处理,得到所述待识别数据中各个字段的特征数据,包括:
4.根据权利要求1所述的校准方法,其特征在于,所述根据所述待识别数据的分类标签,从预设校准库中选择目标文本纠错模型,包括:
5.根据权利要求1所述的校准方...
【专利技术属性】
技术研发人员:王鑫,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。