【技术实现步骤摘要】
一种基于模型的金融交易文件及金额的提取方法
[0001]本专利技术涉及金融交易领域,尤其涉及一种基于模型的金融交易文件及金额的提取方法。
技术介绍
[0002]金融领域中交易文件的登记信息中,交易金额往往在表格中显示,然而同一表格中可能含有多个类目(种类,不同的类目名称进行区分)的金额以及税前税后的总金额,由于数据未进行整理,且大多通过图片的形式存在,导致这种多类目的金额的数据较为混乱,对于精准有效地提取目标金额造成很大的困扰。
[0003]现有技术中,通常根据交易种类的区别,采用两种不同的方法提取交易的类目名称、交易金额。第一种方法是针对法律文书的特殊数据来进行处理,很难适用于含有大量表格的交易文件场景的特殊数据的处理;第二种方法对于多类目的金额处理,通过人工进行统计,因此,需要投入大量的人力和时间,导致成本较高,而且该种方式的准确率和可以迁移性较差。
[0004]因此,现有技术存在缺陷,需要改进。
技术实现思路
[0005]本专利技术的目的是克服现有技术的不足,提供一种基于模型的金融交易文 ...
【技术保护点】
【技术特征摘要】
1.一种基于模型的金融交易文件及金额的提取方法,其特征在于,包括以下步骤:S1:数据处理模块以图片的形式获取交易业务中的交易文件,形成交易图片;S2:采用OCR技术识别出所述交易图片上的交易表格中的所有的数据信息,并存储所述数据信息;所述数据信息包括:内容信息、以及每一个内容信息所对应的位置信息;所述内容信息为金额或类目名称;S3:标注每一个金额在所述交易表格中所对应的位置信息以及该金额在所述交易表格中所对应的类目名称的位置信息,依次形成表格内容1、表格内容2、
…
、表格内容n;S4:分别将表格内容1、表格内容2、
…
、表格内容n输入至训练模型内,训练模型对表格内容1、表格内容2、
…
、表格内容n的位置信息进行合并,并输出预测标签;所述预测标签包括:所述交易表格内所有种类的类目名称,以及每一个类目名称所对应的所有金额;S5:将所述预测标签与人工标签进行对比,判断是否存在误差;所述人工标签为:通过人工进行交易表格中同一类目名称所对应的金额的统计结果;S6:若不存在误差,则用户可上传待提取文件,通过数据处理模块将所述待提取文件转换为图片格式,并重复步骤S2~S3;S7:将经过步骤S6后获...
【专利技术属性】
技术研发人员:陈加杰,
申请(专利权)人:深圳前海环融联易信息科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。