【技术实现步骤摘要】
数据处理方法、计算机设备及计算机存储介质
[0001]本申请实施例涉及数据处理领域,具体涉及一种数据处理方法、计算机设备及计算机存储介质。
技术介绍
[0002]在对财务报表进行分析的场景中,通常只能获取图像、扫描文档之类的图像式电子文档,然后人工耗费大量精力将图像式的电子文档中的信息手动还原成可编辑和计算的数据信息后,再手动编辑财务指标的计算公式,根据该计算公式对还原得到的数据信息进行计算处理,以分析企业的财务经营状况。
[0003]由于财务报表纷繁复杂的数据信息通常以各式各样的表格展现出来,将其手动转化成可计算、可分析的数据源,十分耗时耗力,且人工还原的准确性无法保证。另外,对于需要分析大量财务数据的场景,重复编辑财务指标的计算公式,也颇为繁琐,且若选作分析的指标发生变更,还需手动更新所有财务数据的计算公式,耗费大量的人力物力。
技术实现思路
[0004]本申请实施例提供了一种数据处理方法、计算机设备及计算机存储介质,用于对源数据中的表格进行识别和提取文本数据进而对文本数据进行分析处理,节省人力物 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取源数据,所述源数据包括表格;对所述源数据中的表格进行识别,以提取出所述源数据的表格中的文本数据;根据预设处理算法对提取到的所述文本数据进行处理,获得数据处理结果。2.根据权利要求1所述的方法,其特征在于,所述对所述源数据中的表格进行识别,以提取出所述源数据的表格中的文本数据,包括:将所述源数据转换为目标图像,采用图像矫正算法对所述目标图像进行矫正,获得矫正图像;采用文本识别算法对所述矫正图像进行文本识别,以提取出所述矫正图像中的表格的所述文本数据。3.根据权利要求2所述的方法,其特征在于,所述采用文本识别算法对所述矫正图像进行文本识别,以提取出所述矫正图像中的表格的所述文本数据,包括:采用文本识别算法对所述矫正图像进行文本识别,根据所述矫正图像建立坐标系,在所述坐标系中确定所述矫正图像对应的文本数据的坐标;将所述矫正图像对应的文本数据的坐标与预设类型文本的坐标进行比对,将所述矫正图像中坐标与所述预设类型文本的坐标相匹配的文本数据确定为所述矫正图像中的表格的文本数据。4.根据权利要求1所述的方法,其特征在于,所述根据预设处理算法对提取到的所述文本数据进行处理,获得数据处理结果,包括:接收用户设置的多个分析指标,根据所述预设处理算法将提取到的所述文本数据处理为所述多个分析指标对应的数据处理结果。5.根据权利要...
【专利技术属性】
技术研发人员:梁晓营,曾裕,朱立民,
申请(专利权)人:招银云创信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。