System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 关键信息提取方法、装置和合同签约的监管方法、装置制造方法及图纸_技高网

关键信息提取方法、装置和合同签约的监管方法、装置制造方法及图纸

技术编号:40839970 阅读:5 留言:0更新日期:2024-04-01 15:06
提供了一种关键信息提取方法、装置和合同签约的监管方法、装置,可以应用于大数据技术领域和人工智能技术领域。所述关键信息提取方法包括:识别目标合同文件中的银行账号信息和所述银行账号信息对应的校验信息;将所述银行账号信息输入信息去除模型进行无效信息的过滤,输出账号过滤信息;按照预设的拆分规则,利用信息拆分模型对所述账号过滤信息进行拆分,输出N条拆分关键信息,其中,N为正整数;基于所述校验信息,利用信息校验模型分别对所述N条拆分关键信息进行有效性验证,输出验证结果;以及响应于验证结果为通过,将对应的拆分关键信息作为有效关键信息进行输出。

【技术实现步骤摘要】

本专利技术涉及大数据和人工智能,更具体地涉及一种关键信息提取方法、装置和合同签约的监管方法、装置


技术介绍

1、当前银行与客户的合同签约通常通过电子签约系统进行,由客户经理代表银行完成与客户的签约工作。合同签约后,客户经理需要执行一系列的履约步骤,如将签约账户录入监管系统、根据合同要求进行资金操作等。这些步骤在流程上与签约环节不直接联动,需要客户经理独立操作和管理。

2、然而,由于目前在合同管理过程中,通常通过人工的方式进行关键信息的校验,效率低下且有操作失误的风险。并且,由于履约步骤与签约流程分离,存在客户经理操作不及时的问题,可能导致合同相关的关键操作延误,表现在:若客户经理遗漏或延迟执行履约步骤,如未能及时将账户录入监管系统,可能导致银行无法按时拦截可疑交易,从而引发合同违约和相关的风险事件。


技术实现思路

1、鉴于上述问题,根据本专利技术的第一方面,提供了-种关键信息提取方法,所述方法包括:识别目标合同文件中的银行账号信息和所述银行账号信息对应的校验信息;将所述银行账号信息输入信息去除模型进行无效信息的过滤,输出账号过滤信息;按照预设的拆分规则,利用信息拆分模型对所述账号过滤信息进行拆分,输出n条拆分关键信息,其中,n为正整数;基于所述校验信息,利用信息校验模型分别对所述n条拆分关键信息进行有效性验证,输出验证结果;以及响应于验证结果为通过,将对应的拆分关键信息作为有效关键信息进行输出。

2、根据一些示例性实施例,所述按照预设的拆分规则,利用信息拆分模型对所述账号过滤信息进行拆分,输出n条拆分关键信息,具体包括:按照银行账号长度和格式定义所述拆分规则;基于所述拆分规则,对所述账号过滤信息进行特征工程,输出账号字符序列;以及将所述账号字符序列输入所述信息拆分模型进行账号边界的识别,输出n条拆分关键信息。

3、根据一些示例性实施例,利用transformer模型训练所述信息拆分模型,其中,所述信息拆分模型的训练集包括:包含单个账号或连续账号的原始文本数据以及对应的标识信息。

4、根据一些示例性实施例,所述信息校验模型包括凭证信息校验模型、身份信息校验模型和联系信息校验模型,所述校验信息包括凭证号、身份证号和手机号;所述基于所述校验信息,利用信息校验模型分别对所述n条拆分关键信息进行有效性验证,输出验证结果,具体包括:基于凭证信息的结构特征编写第一正则表达式,作为所述凭证信息校验模型,利用所述凭证信息校验模型验证凭证号的有效性,获得第一验证结果;根据身份信息的标准实现校验算法,作为所述身份信息校验模型,利用所述身份信息校验模型验证身份证号的结构和合法性,获得第二验证结果;根据手机号的标准编写第二正则表达式,作为所述联系信息校验模型,利用所述联系信息校验模型验证手机号的格式和长度,获得第三验证结果;以及响应于所述第一验证结果、第二验证结果和第三验证结果均为通过,输出所述验证结果为通过。

5、根据一些示例性实施例,所述识别目标合同文件中的银行账号信息和所述银行账号信息对应的校验信息,具体包括:基于ocr技术,将所述目标合同文件转换为可编辑文本;获取目标关键词,利用字符串匹配算法确定所述目标关键词在所述可编辑文本中的位置;基于所述银行账号信息和所述校验信息设定搜索参数;以及基于所述搜索参数和所述位置,从所述可编辑文本中识别所述银行账号信息和所述校验信息。

6、根据一些示例性实施例,所述将所述银行账号信息输入信息去除模型进行无效信息的过滤,输出账号过滤信息,具体包括:编写自定义过滤器作为所述信息去除模型,其中,所述自定义过滤器用于过滤所述银行账号信息中的空格、特殊字符、非数字字符、汉字、字母和/或标点符号。

7、根据本专利技术的第二方面,提出了一种合同签约的监管方法,所述方法包括:获取目标合同的信息和目标合同对应的文件流;将所述目标合同对应的文件流转换为目标合同文件;利用如第一方面所述的方法,获取所述目标合同文件中的有效关键信息,并将所述有效关键信息加入监管模型的数据库;以及响应于所述有效关键信息对应的账户产生交易,利用所述监管模型对所述交易的明细进行核查校验,输出监管结果。

8、根据一些示例性实施例,所述将所述目标合同对应的文件流转换为目标合同文件,具体包括:解码通过base64编码的所述文件流,确定所述文件流的格式;以及基于所述格式,将所述文件流写入磁盘文件,创建可读文件作为所述目标合同文件。

9、根据本专利技术的第三方面,提出了一种关键信息提取装置,所述装置包括:信息识别模块,用于:识别目标合同文件中的银行账号信息和所述银行账号信息对应的校验信息;无效信息过滤模块,用于:将所述银行账号信息输入信息去除模型进行无效信息的过滤,输出账号过滤信息;信息拆分模块,用于:按照预设的拆分规则,利用信息拆分模型对所述账号过滤信息进行拆分,输出n条拆分关键信息,其中,n为正整数;有效性验证模块,用于:基于所述校验信息,利用信息校验模型分别对所述n条拆分关键信息进行有效性验证,输出验证结果;以及有效关键信息输出模块,用于:响应于验证结果为通过,将对应的拆分关键信息作为有效关键信息进行输出。

10、根据一些示例性实施例,所述信息识别模块可以包括可编辑文本转换单元、目标关键词确定单元、搜索参数设置单元和识别单元。

11、根据一些示例性实施例,所述可编辑文本转换单元可以用于基于ocr技术,将所述目标合同文件转换为可编辑文本。

12、根据一些示例性实施例,所述目标关键词确定单元可以用于获取目标关键词,利用字符串匹配算法确定所述目标关键词在所述可编辑文本中的位置。

13、根据一些示例性实施例,所述搜索参数设置单元可以用于基于所述银行账号信息和所述校验信息设定搜索参数。

14、根据一些示例性实施例,所述识别单元可以用于基于所述搜索参数和所述位置,从所述可编辑文本中识别所述银行账号信息和所述校验信息。

15、根据一些示例性实施例,所述无效信息过滤模块可以包括自定义过滤器编写单元。

16、根据一些示例性实施例,所述自定义过滤器编写单元可以用于编写自定义过滤器作为所述信息去除模型,其中,所述自定义过滤器用于过滤所述银行账号信息中的空格、特殊字符、非数字字符、汉字、字母和/或标点符号。

17、根据一些示例性实施例,所述信息拆分模块可以包括拆分规则定义单元、特征工程单元和账号边界识别单元。

18、根据一些示例性实施例,所述拆分规则定义单元可以用于按照银行账号长度和格式定义所述拆分规则。

19、根据一些示例性实施例,所述特征工程单元可以用于基于所述拆分规则,对所述账号过滤信息进行特征工程,输出账号字符序列。

20、根据一些示例性实施例,所述账号边界识别单元可以用于将所述账号字符序列输入所述信息拆分模型进行账号边界的识别,输出n条拆分关键信息。

21、根据一些示例性实施例,所述有效性验证模块可以包括凭证信息验证单元、身本文档来自技高网...

【技术保护点】

1.一种关键信息提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述按照预设的拆分规则,利用信息拆分模型对所述账号过滤信息进行拆分,输出N条拆分关键信息,具体包括:

3.根据权利要求2所述的方法,其特征在于,利用Transformer模型训练所述信息拆分模型,其中,所述信息拆分模型的训练集包括:包含单个账号或连续账号的原始文本数据以及对应的标识信息。

4.根据权利要求1所述的方法,其特征在于,所述信息校验模型包括凭证信息校验模型、身份信息校验模型和联系信息校验模型,所述校验信息包括凭证号、身份证号和手机号;

5.根据权利要求1~4中的任一项所述的方法,其特征在于,所述识别目标合同文件中的银行账号信息和所述银行账号信息对应的校验信息,具体包括:

6.根据权利要求1~4中的任一项所述的方法,其特征在于,所述将所述银行账号信息输入信息去除模型进行无效信息的过滤,输出账号过滤信息,具体包括:

7.一种合同签约的监管方法,其特征在于,所述方法包括:

8.根据权利要求7所述的方法,其特征在于,所述将所述目标合同对应的文件流转换为目标合同文件,具体包括:

9.一种关键信息提取装置,其特征在于,所述装置包括:

10.一种合同签约的监管装置,其特征在于,所述装置包括:

11.一种电子设备,包括:

12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~8中任一项所述的方法。

...

【技术特征摘要】

1.一种关键信息提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述按照预设的拆分规则,利用信息拆分模型对所述账号过滤信息进行拆分,输出n条拆分关键信息,具体包括:

3.根据权利要求2所述的方法,其特征在于,利用transformer模型训练所述信息拆分模型,其中,所述信息拆分模型的训练集包括:包含单个账号或连续账号的原始文本数据以及对应的标识信息。

4.根据权利要求1所述的方法,其特征在于,所述信息校验模型包括凭证信息校验模型、身份信息校验模型和联系信息校验模型,所述校验信息包括凭证号、身份证号和手机号;

5.根据权利要求1~4中的任一项所述的方法,其特征在于,所述识别目标合同文件中的银行账号信息和所述...

【专利技术属性】
技术研发人员:李泊言
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1