财务报表处理方法和装置制造方法及图纸

技术编号:22331217 阅读:37 留言:0更新日期:2019-10-19 12:29
本发明专利技术公开了一种财务报表处理方法和装置,涉及大数据领域。该财务报表处理方法包括:预先基于已存储的各企业的财务报表创建专业词汇库,所述专业词汇库中包含字段模板,每个所述字段模板关联多个模糊匹配字段;将待处理财务报表中的各数据字段分别与所述专业词汇库中的字段模板进行匹配,并且根据所述匹配的结果对所述待处理财务报表进行归一化存储;按照预设分析规则,对归一化存储的所述待处理财务报表中的多个数据字段进行关联计算,并且根据所述关联计算的结果生成财务分析报表。本发明专利技术实施例提供的技术方案能够解决现有技术中财务报表数据利用率低的问题。

【技术实现步骤摘要】
财务报表处理方法和装置
本专利技术涉及大数据领域,尤其涉及一种财务报表处理方法和装置。
技术介绍
财务报表是反映企业或预算单位一定时期内资金、利润状况的会计报表,具有统一的格式、类型,要求企业定期编报。目前对企业财报数据的使用往往处于比较初级的阶段,多停留在查看财务报表所披露的数据的程度,比如根据财务报表查看企业的营收情况等。如果需要对财务报表进行深入分析,多通过专业的财会人员人工作业,然而分析结果又受限于分析人员的经验水平。基于上述原因导致财务报表数据的利用率比较低。
技术实现思路
有鉴于此,本专利技术实施例提供了一种财务报表处理方法和装置,用以解决现有技术中财务报表数据利用率比较低的问题。一方面,本专利技术实施例提供了一种财务报表处理方法,所述方法包括:预先基于已存储的各企业的财务报表创建专业词汇库,所述专业词汇库中包含字段模板,每个所述字段模板关联多个模糊匹配字段;将待处理财务报表中的各数据字段分别与所述专业词汇库中的字段模板进行匹配,并且根据所述匹配的结果对所述待处理财务报表进行归一化存储;其中,当所述待处理财务报表中的数据字段与所对应的字段模板所关联的多个模糊匹配字段中的其中一个匹配时,将所述数据字段归一化存储为其所匹配的模糊匹配字段所对应的字段模板;按照预设分析规则,对归一化存储的所述待处理财务报表中的多个数据字段进行关联计算,并且根据所述关联计算的结果生成财务分析报表。进一步地,基于已存储的各企业的财务报表创建专业词汇库,包括:采用网络爬虫技术从互联网络中爬取已公开的各企业的财务报表;对爬取的所述各企业的财务报表分类;分别对每类财务报表中的各数据字段进行识别并且将从每类财务报表中识别出的数据字段作为模糊匹配字段关联至对应的字段模板;对从各类财务报表中得到的模糊匹配字段和字段模板的关联关系进行汇总得到所述专业词汇库。进一步地,所述按照预设分析规则,对归一化存储的所述待处理财务报表中的多个数据字段进行关联计算,并且根据所述关联计算的结果生成财务分析报表,包括:从一份或多份归一化存储的待处理财务报表中提取多个数据字段;根据提取的所述多个数据字段计算财务统计数据;将所述财务统计数据与对照组统计值进行比对,得到财务分析报表。进一步地,所述根据提取的所述多个数据字段计算财务统计数据,包括:根据财务报表中的收入数据计算业务收益数据;根据财务报表中的资产负债数据计算资产周转数据。进一步地,所述财务报表为PDF格式,识别PDF格式的财务报表中的数据字段,包括:将PDF格式的财务报表转换为灰阶图像文件;对所述灰阶图像文件中的数据部分进行解析并保存为二维数组;采用表格分割线扫描算法对所述二维数组中的表格区域进行识别,根据识别的结果进行表格的分割;对分割的表格中的各个单元格区域中的数据字段进行定位识别。一方面,本专利技术实施例提供了一种财务报表处理装置,所述装置包括:词汇库创建模块,用于预先基于已存储的各企业的财务报表创建专业词汇库,所述专业词汇库中包含字段模板,每个所述字段模板关联多个模糊匹配字段;归一化存储模块,用于将待处理财务报表中的各数据字段分别与所述专业词汇库中的字段模板进行匹配,并且根据所述匹配的结果对所述待处理财务报表进行归一化存储;其中,当所述待处理财务报表中的数据字段与所对应的字段模板所关联的多个模糊匹配字段中的其中一个匹配时,将所述数据字段归一化存储为其所匹配的模糊匹配字段所对应的字段模板;关联计算模块,用于按照预设分析规则,对归一化存储的所述待处理财务报表中的多个数据字段进行关联计算,并且根据所述关联计算的结果生成财务分析报表。进一步地,所述词汇库创建模块,包括:数据爬取单元,用于采用网络爬虫技术从互联网络中爬取已公开的各企业的财务报表;分类单元,用于对爬取的所述各企业的财务报表分类;识别单元,用于分别对每类财务报表中的各数据字段进行识别并且将从每类财务报表中识别出的数据字段作为模糊匹配字段关联至对应的字段模板;汇总单元,用于对从各类财务报表中得到的模糊匹配字段和字段模板的关联关系进行汇总得到所述专业词汇库。进一步地,所述关联计算模块,包括:数据提取单元,用于从一份或多份归一化存储的待处理财务报表中提取多个数据字段;数据计算单元,用于根据提取的所述多个数据字段计算财务统计数据;比对单元,用于将所述财务统计数据与对照组统计值进行比对,得到财务分析报表。一方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述财务报表处理方法的步骤。一方面,本专利技术实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述财务报表处理方法的步骤。在本专利技术实施例中,将企业的财务报表按照字段模板归一化存储后,按照预设分析规则从一份或多份财务报表中提取不同的数据字段,并根据数据字段之间的关联关系进行分析计算得到财务分析报表,由此以实现对财务报表数据更深层次的使用,提高财务报表中数据的利用率。【附图说明】为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1是本专利技术实施例提供的一种可选的财务报表处理方法的流程图;图2是本专利技术实施例提供的一种可选的财务报表处理装置的示意图;图3是本专利技术实施例提供的一种可选的计算机设备的示意图。【具体实施方式】为了更好的理解本专利技术的技术方案,下面结合附图对本专利技术实施例进行详细描述。应当明确,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的相同的字段,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。应当理解,尽管在本专利技术实施例中可能采用术语第一、第二、第三等来描述预设范围等,但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如,在不脱离本专利技术实施例范围的情况下,第一预设范围也可以被称为第二预设范围,类似地,第二预设范围也可以被称为第一预设范围。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。图1是本专利技术实施例提供的一种可选的财务报表处理方法的流程图。如图1所示,该方法包括:步骤S101:预先基于已存本文档来自技高网...

【技术保护点】
1.一种财务报表处理方法,其特征在于,所述方法包括:预先基于已存储的各企业的财务报表创建专业词汇库,所述专业词汇库中包含字段模板,每个所述字段模板关联多个模糊匹配字段;将待处理财务报表中的各数据字段分别与所述专业词汇库中的字段模板进行匹配,并且根据所述匹配的结果对所述待处理财务报表进行归一化存储;其中,当所述待处理财务报表中的数据字段与所对应的字段模板所关联的多个模糊匹配字段中的其中一个匹配时,将所述数据字段归一化存储为其所匹配的模糊匹配字段所对应的字段模板;按照预设分析规则,对归一化存储的所述待处理财务报表中的多个数据字段进行关联计算,并且根据所述关联计算的结果生成财务分析报表。

【技术特征摘要】
1.一种财务报表处理方法,其特征在于,所述方法包括:预先基于已存储的各企业的财务报表创建专业词汇库,所述专业词汇库中包含字段模板,每个所述字段模板关联多个模糊匹配字段;将待处理财务报表中的各数据字段分别与所述专业词汇库中的字段模板进行匹配,并且根据所述匹配的结果对所述待处理财务报表进行归一化存储;其中,当所述待处理财务报表中的数据字段与所对应的字段模板所关联的多个模糊匹配字段中的其中一个匹配时,将所述数据字段归一化存储为其所匹配的模糊匹配字段所对应的字段模板;按照预设分析规则,对归一化存储的所述待处理财务报表中的多个数据字段进行关联计算,并且根据所述关联计算的结果生成财务分析报表。2.根据权利要求1所述的方法,其特征在于,基于已存储的各企业的财务报表创建专业词汇库,包括:采用网络爬虫技术从互联网络中爬取已公开的各企业的财务报表;对爬取的所述各企业的财务报表分类;分别对每类财务报表中的各数据字段进行识别并且将从每类财务报表中识别出的数据字段作为模糊匹配字段关联至对应的字段模板;对从各类财务报表中得到的模糊匹配字段和字段模板的关联关系进行汇总得到所述专业词汇库。3.根据权利要求1所述的方法,其特征在于,所述按照预设分析规则,对归一化存储的所述待处理财务报表中的多个数据字段进行关联计算,并且根据所述关联计算的结果生成财务分析报表,包括:从一份或多份归一化存储的待处理财务报表中提取多个数据字段;根据提取的所述多个数据字段计算财务统计数据;将所述财务统计数据与对照组统计值进行比对,得到财务分析报表。4.根据权利要求3所述的方法,其特征在于,所述根据提取的所述多个数据字段计算财务统计数据,包括:根据财务报表中的收入数据计算业务收益数据;根据财务报表中的资产负债数据计算资产周转数据。5.根据权利要求1所述的方法,其特征在于,所述财务报表为PDF格式,识别PDF格式的财务报表中的数据字段,包括:将PDF格式的财务报表转换为灰阶图像文件;对所述灰阶图像文件中的数据部分进行解析并保存为二维数组;采用表格分割线扫描算法对所述二维数组中的表格区域进行识别,根据识别的结...

【专利技术属性】
技术研发人员:李晨光
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1