数据处理方法、计算机设备及计算机存储介质技术

技术编号:36248904 阅读:30 留言:0更新日期:2023-01-07 09:41
本申请实施例公开了一种数据处理方法、计算机设备及计算机存储介质。本申请实施例包括:计算机设备获取源数据,并对源数据中的表格进行识别,以提取出源数据的表格中的文本数据,根据预设处理算法对提取到的文本数据进行处理,获得数据处理结果。因此,无需再由人工手动将表格转化为可计算分析的数据源,从而节省人力成本,也无需人工重复编辑数据的计算公式,只需由计算机设备根据预设处理算法对表格中提取到的文本数据进行处理即可,可节省大量的人力物力,同时也能确保数据提取的准确性以及确保数据分析的准确性。及确保数据分析的准确性。及确保数据分析的准确性。

【技术实现步骤摘要】
数据处理方法、计算机设备及计算机存储介质


[0001]本申请实施例涉及数据处理领域,具体涉及一种数据处理方法、计算机设备及计算机存储介质。

技术介绍

[0002]在对财务报表进行分析的场景中,通常只能获取图像、扫描文档之类的图像式电子文档,然后人工耗费大量精力将图像式的电子文档中的信息手动还原成可编辑和计算的数据信息后,再手动编辑财务指标的计算公式,根据该计算公式对还原得到的数据信息进行计算处理,以分析企业的财务经营状况。
[0003]由于财务报表纷繁复杂的数据信息通常以各式各样的表格展现出来,将其手动转化成可计算、可分析的数据源,十分耗时耗力,且人工还原的准确性无法保证。另外,对于需要分析大量财务数据的场景,重复编辑财务指标的计算公式,也颇为繁琐,且若选作分析的指标发生变更,还需手动更新所有财务数据的计算公式,耗费大量的人力物力。

技术实现思路

[0004]本申请实施例提供了一种数据处理方法、计算机设备及计算机存储介质,用于对源数据中的表格进行识别和提取文本数据进而对文本数据进行分析处理,节省人力物力的同时提升数据提取本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取源数据,所述源数据包括表格;对所述源数据中的表格进行识别,以提取出所述源数据的表格中的文本数据;根据预设处理算法对提取到的所述文本数据进行处理,获得数据处理结果。2.根据权利要求1所述的方法,其特征在于,所述对所述源数据中的表格进行识别,以提取出所述源数据的表格中的文本数据,包括:将所述源数据转换为目标图像,采用图像矫正算法对所述目标图像进行矫正,获得矫正图像;采用文本识别算法对所述矫正图像进行文本识别,以提取出所述矫正图像中的表格的所述文本数据。3.根据权利要求2所述的方法,其特征在于,所述采用文本识别算法对所述矫正图像进行文本识别,以提取出所述矫正图像中的表格的所述文本数据,包括:采用文本识别算法对所述矫正图像进行文本识别,根据所述矫正图像建立坐标系,在所述坐标系中确定所述矫正图像对应的文本数据的坐标;将所述矫正图像对应的文本数据的坐标与预设类型文本的坐标进行比对,将所述矫正图像中坐标与所述预设类型文本的坐标相匹配的文本数据确定为所述矫正图像中的表格的文本数据。4.根据权利要求1所述的方法,其特征在于,所述根据预设处理算法对提取到的所述文本数据进行处理,获得数据处理结果,包括:接收用户设置的多个分析指标,根据所述预设处理算法将提取到的所述文本数据处理为所述多个分析指标对应的数据处理结果。5.根据权利要...

【专利技术属性】
技术研发人员:梁晓营曾裕朱立民
申请(专利权)人:招银云创信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1