【技术实现步骤摘要】
一种提取方法、装置、设备及存储介质
[0001]本申请涉及数据提取
,特别是涉及一种提取方法、装置、设备及存储介质。
技术介绍
[0002]企业客户的财报信息在风险控制环节发挥着重要的作用,银行会针对客户提供的财报信息对客户进行评级,进而决定是否对该企业进行放款。所以,需要准确高效地将财报数据录入到银行系统中。
[0003]现有技术中,首先,需要通过扫描将纸质版的财报转换为电子版;然后通过云服务器中集成的文字识别模块(optical character recognition,OCR)对财报中的文本进行识别;最后,提取评级所需的财报数据。由于OCR模块集成在云端服务器中,需要对云端服务器进行维护。因此,会产生大量的维护成本。
[0004]有鉴于此,如何降低对云端服务器的维护成本是本领域技术人员需要解决的技术问题。
技术实现思路
[0005]基于上述问题,本申请提供了一种提取方法、装置、设备及存储介质,降低对云端服务器的维护成本。
[0006]本申请实施例公开了如下技术方案: />[0007]第一本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种提取方法,其特征在于,所述方法包括:接收智能设备发送的目标提取数据以及对第一表格的识别结果;所述识别结果包括第一表格中的文本内容以及所述文本内容所在单元的坐标;根据所述文本内容所在单元的坐标,生成关于所述文本内容的第二表格;根据所述目标提取数据,确定所述目标提取数据在所述第二表格中的位置信息;根据所述位置信息,从所述第二表格中提取目标数据。2.如权利要求1所述的方法,其特征在于,所述生成关于所述文本内容的第二表格之前,所述方法还包括:通过自然语言处理技术对接收到的所述文本内容进行纠错,得到修改意见;根据所述修改意见,对所述文本内容进行修正。3.如权利要求1所述的方法,其特征在于,所述根据所述目标提取数据,确定所述目标提取数据在所述第二表格中的位置信息,具体包括:通过字段匹配的方式在所述第二表格中为所述目标提取数据匹配对应的行号和列号;根据所述行号和所述列号,确定所述目标提取数据在所述第二表格中的位置信息。4.如权利要求1所述的方法,其特征在于,所述从所述第二表格中提取目标数据,具体包括:采用深度学习模型,从所述第二表格中提取目标数据;所述深度学习模型通过样本目标提取数据以及所述样本目标提取数据所对应的行列信息训练得到。5.如权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:获取提取到的目标数据在第二表格中对应的单元的坐标;根据所述目标数据在第二表格中对应的单元的坐标,获得该坐标在所述第一表格中对应的文本内容;若获取到的目标数据与所述目标数据单元坐标下的...
【专利技术属性】
技术研发人员:黄倩颖,郭慧杰,刘交,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。