文件的处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:38003865 阅读:7 留言:0更新日期:2023-06-30 10:18
本发明专利技术公开了一种文件的处理方法、装置、存储介质及电子设备。涉及人工智能技术领域。其中,该方法包括:获取目标委托文件,其中,目标委托文件至少包括:代理委托书,代理委托书至少包括:目标对象委托金融机构处理交易的委托书;将目标委托文件输入分类模型中,输出目标委托文件的文件模板类型,其中,分类模型为已训练的神经网络模型;基于文件模板类型,提取目标委托文件中的N个交易信息,得到目标信息集合;将目标信息集合中的N个交易信息添加至目标系统,其中,目标系统为金融机构的应用系统。本发明专利技术解决了相关技术中采用人工录入的方式,将金融市场的交易代理委托书中的交易要素录入交易簿记系统效果不佳的技术问题。素录入交易簿记系统效果不佳的技术问题。素录入交易簿记系统效果不佳的技术问题。

【技术实现步骤摘要】
文件的处理方法、装置、存储介质及电子设备


[0001]本专利技术涉及人工智能
,具体而言,涉及一种文件的处理方法、装置、存储介质及电子设备。

技术介绍

[0002]在金融市场代理交易领域,国外投资者无法直接开展交易,需委托国内有资质机构(如:金融机构)代理开展交易。在开展交易时,国外机构投资者将代理委托书发送给金融机构交易员后,由金融机构交易员根据委托书中交易要素手工录入交易簿记系统中。在进行代理交易时,由于客户均为国外客户,且分布在不同国家,因此,代理委托书语言多样,并且金融机构代理客户交易时一般以服务客户为宗旨,因此,不同客户委托书样式也存在差异,进一步增加了手工录入的挑战性。
[0003]目前,代理交易手工录入交易方式有以下几种不足:(1)交易员需根据委托书内容提取交易要素后手工录入交易簿记系统,录入一笔交易的耗时约10分钟左右;(2)委托书中包含的交易要素信息并不完整,例如需要基于客户名称簿记客户账户、客户账户托管机构等;(3)交易员在录入时,由于是手工提取交易要素,尤其是金额等交易要素可能会出错,或者需要反复复核防止出错;(1)在特殊日期(比如月末),国外委托交易较多,单日可能需要录入几十甚至上百笔交易,由交易员手工处理时效率低下。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种文件的处理方法、装置、存储介质及电子设备,以至少解决相关技术中采用人工录入的方式,将金融市场的交易代理委托书中的交易要素录入交易簿记系统效果不佳的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种文件的处理方法,包括:获取目标委托文件,其中,所述目标委托文件至少包括:代理委托书,所述代理委托书至少包括:目标对象委托金融机构处理交易的委托书;将所述目标委托文件输入分类模型中,输出所述目标委托文件的文件模板类型,其中,所述分类模型为已训练的神经网络模型;基于所述文件模板类型,提取所述目标委托文件中的N个交易信息,得到目标信息集合,其中,N为大于1的整数;将所述目标信息集合中的N个交易信息添加至目标系统,其中,所述目标系统为所述金融机构的应用系统。
[0007]进一步地,基于所述文件模板类型,提取所述目标委托文件中的N个交易信息,得到目标信息集合,包括:通过信息识别模型,提取所述目标委托文件中的N个交易信息,得到交易信息集合,其中,所述信息识别模型的类型至少包括:光学字符识别模型;计算每个交易信息与对应的历史交易信息的相似度,得到多个相似度,其中,所述历史交易信息关联的历史文件与所述目标委托文件之间使用的文件模板类型相同;基于多个所述相似度和所述交易信息集合,确定所述目标信息集合。
[0008]进一步地,在通过信息识别模型,提取所述目标委托文件中的N个交易信息,得到交易信息集合之前,包括:对所述目标委托文件进行格式校验,其中,所述格式校验的校验内容至少包括以下其中之一:校验文件大小、校验文件名长度、校验文件数量;在所述格式校验通过校验的情况下,执行所述通过信息识别模型,提取所述目标委托文件中的N个交易信息,得到交易信息集合的步骤。
[0009]进一步地,基于多个所述相似度和所述交易信息集合,确定所述目标信息集合,包括:判断每个所述相似度是否大于预设相似度阈值;在存在大于所述预设相似度阈值的目标相似度情况下,确定是否替换所述目标相似度关联的交易信息;在确定替换所述目标相似度关联的交易信息的情况下,将所述目标相似度关联的交易信息替换为所述目标相似度关联的历史交易信息;基于所述交易信息集合和替换后的交易信息,确定所述目标信息集合。
[0010]进一步地,将所述目标信息集合中的N个交易信息添加至目标系统的步骤,包括:基于所述目标信息集合,获取所述目标系统中的关联交易信息,其中,所述关联交易信息至少包括:所述目标系统中与所述N个交易信息关联的客户信息、交易产品信息以及竞争对手信息;将所述N个交易信息和所述关联交易信息添加至所述目标系统。
[0011]进一步地,所述分类模型通过以下方式得到:获取多个第一训练样本,其中,所述多个第一训练样本至少包括:带分类标记的历史时间段的代理委托书,其中,所述分类标记用于标记代理委托书的文件模板类型;基于预设比例,将所述多个第一训练样本划分为训练集、验证集、测试集;通过所述训练集对初始模型进行模型训练,并基于所述验证集和所述测试集确定所述初始模型是否收敛,其中,所述初始模型为未训练完成的所述分类模型,所述初始模型的类型至少包括:深度残差网络模型;在所述初始模型收敛的情况下,得到所述分类模型。
[0012]进一步地,获取多个第一训练样本,包括:获取多个历史文件,其中,多个所述历史文件至少包括:所述历史时间段内已经识别完毕的代理委托书;将每个所述历史文件转换为图片格式,得到每个所述历史文件的第一图片文件;对所述第一图片文件中的每张图片的尺寸进行标准化处理,得到第二图片文件;对所述第二图片文件中的每张图片进行目标处理,得到第三图片文件,其中,所述目标处理至少包括以下其中之一:翻转、拉伸、加噪;标记每个所述历史文件关联的所述第三图片文件的文件模板类型,得到所述多个第一训练样本。
[0013]进一步地,所述信息识别模型通过以下方式得到:获取多个第二历史文件,其中,所述多个第二历史文件至少包括:带交易信息标记的历史时间段的代理委托书;基于所述多个第二历史文件对初始识别模型进行模型训练,得到所述信息识别模型,其中,所述初始识别模型的类型至少包括:光学字符识别模型。
[0014]根据本专利技术实施例的另一方面,还提供了一种文件的处理装置,包括:第一获取单元,用于获取目标委托文件,其中,所述目标委托文件至少包括:代理委托书,所述代理委托书至少包括:目标对象委托金融机构处理交易的委托书;处理单元,用于将所述目标委托文件输入分类模型中,输出所述目标委托文件的文件模板类型,其中,所述分类模型为已训练的神经网络模型;提取单元,用于基于所述文件模板类型,提取所述目标委托文件中的N个交易信息,得到目标信息集合,其中,N为大于1的整数;添加单元,用于将所述目标信息集合
中的N个交易信息添加至目标系统,其中,所述目标系统为所述金融机构的应用系统。
[0015]进一步地,提取单元包括:提取子单元,用于通过信息识别模型,提取所述目标委托文件中的N个交易信息,得到交易信息集合,其中,所述信息识别模型的类型至少包括:光学字符识别模型;计算子单元,用于计算每个交易信息与对应的历史交易信息的相似度,得到多个相似度,其中,所述历史交易信息关联的历史文件与所述目标委托文件之间使用的文件模板类型相同;确定子单元,用于基于多个所述相似度和所述交易信息集合,确定所述目标信息集合。
[0016]进一步地,提取单元还包括:校验子单元,用于在通过信息识别模型,提取所述目标委托文件中的N个交易信息,得到交易信息集合之前,对所述目标委托文件进行格式校验,其中,所述格式校验的校验内容至少包括以下其中之一:校验文件大小、校本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件的处理方法,其特征在于,包括:获取目标委托文件,其中,所述目标委托文件至少包括:代理委托书,所述代理委托书至少包括:目标对象委托金融机构处理交易的委托书;将所述目标委托文件输入分类模型中,输出所述目标委托文件的文件模板类型,其中,所述分类模型为已训练的神经网络模型;基于所述文件模板类型,提取所述目标委托文件中的N个交易信息,得到目标信息集合,其中,N为大于1的整数;将所述目标信息集合中的N个交易信息添加至目标系统,其中,所述目标系统为所述金融机构的应用系统。2.根据权利要求1所述的处理方法,其特征在于,基于所述文件模板类型,提取所述目标委托文件中的N个交易信息,得到目标信息集合,包括:通过信息识别模型,提取所述目标委托文件中的N个交易信息,得到交易信息集合,其中,所述信息识别模型的类型至少包括:光学字符识别模型;计算每个交易信息与对应的历史交易信息的相似度,得到多个相似度,其中,所述历史交易信息关联的历史文件与所述目标委托文件之间使用的文件模板类型相同;基于多个所述相似度和所述交易信息集合,确定所述目标信息集合。3.根据权利要求2所述的处理方法,其特征在于,在通过信息识别模型,提取所述目标委托文件中的N个交易信息,得到交易信息集合之前,所述方法还包括:对所述目标委托文件进行格式校验,其中,所述格式校验的校验内容至少包括以下其中之一:校验文件大小、校验文件名长度、校验文件数量;在所述格式校验通过校验的情况下,执行所述通过信息识别模型,提取所述目标委托文件中的N个交易信息,得到所述交易信息集合的步骤。4.根据权利要求2所述的处理方法,其特征在于,基于多个所述相似度和所述交易信息集合,确定所述目标信息集合,包括:判断每个所述相似度是否大于预设相似度阈值;在存在大于所述预设相似度阈值的目标相似度情况下,确定是否替换所述目标相似度关联的交易信息;在确定替换所述目标相似度关联的交易信息的情况下,将所述目标相似度关联的交易信息替换为所述目标相似度关联的历史交易信息;基于所述交易信息集合和替换后的交易信息,确定所述目标信息集合。5.根据权利要求1所述的处理方法,其特征在于,将所述目标信息集合中的N个交易信息添加至目标系统的步骤,包括:基于所述目标信息集合,获取所述目标系统中的关联交易信息,其中,所述关联交易信息至少包括:所述目标系统中与所述N个交易信息关联的客户信息、交易产品信息以及竞争对手信息;将所述N个交易信息和所述关联交易信息添加至所述目标系统。6.根据权利要求1所述的处理方法,其特征在于,所述分类模型通过以下方式得到:获取多个第一训练样本,其中,所述多个第一...

【专利技术属性】
技术研发人员:秦家祥伍如意许璟亮戎伟峰
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1