一种对比报表的方法和装置制造方法及图纸

技术编号:24168716 阅读:17 留言:0更新日期:2020-05-16 02:15
本发明专利技术公开了一种对比报表方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从包含报表的文件中提取待对比的至少两个报表;获取所述报表中单元格所在的行数和列数;对比至少两个报表中相同行数和列数所对应的所述单元格中包含的内容。该实施方式能够不依赖自然语言处理方法和人工对比操作,快速且较为准确地对多版本定期报告中的报表进行对比,提高了对比报表的效率,减少了对比报表的工作量。

【技术实现步骤摘要】
一种对比报表的方法和装置
本专利技术涉及计算机
,尤其涉及一种对比报表的方法和装置。
技术介绍
一般地,上市公司按规定需要提交股东的公司季度、半年度、年度财务报表。报表中包含公司的经营情况、资产负债等信息以体现公司的业绩变化。此类报表的格式是固定的,页数达到上百页。一个上市公司随着经济业务范围的扩张和业务规模不断扩大,需要出具多种语言版本的报表,会面临人力资源紧缺、核对报表工作量加大等难题。现有方式对比多语言版本文件的报表有以下两种方式:1、利用人工将不同语言版本文件中包含报表的章节切分出来,将相同的章节放在一起,并安排不同的工作人员进行核对。2、运用自然语言处理技术,自动识别章节中的报表,将自然语言处理判定为相同词义的表格项进行核对。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:1、利用人工核对的方式,准确率较高,但是此方法耗时耗力,且依赖核对人员的工作能力。2、运用自然语言处理技术,此方法需要大量的语料库训练集合进行机器学习,同时也存在准确率偏低的问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种对比报表的方法和装置,能够不依赖自然语言处理方法和人工对比操作,快速且较为准确地对多版本定期报告中的报表进行对比,提高了对比报表的效率,减少了对比报表的工作量。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种对比报表的方法,其特征在于,包括:从包含报表的文件中提取待对比的至少两个报表;获取所述报表中单元格所在的行数和列数;对比至少两个报表中相同行数和列数所对应的所述单元格中包含的内容。可选地,对比报表的方法,其特征在于,确定至少两个所述报表具有相同的所述行数、所述列数以及相同的格式;所述格式指示为所述报表中包含行标题,列标题和数据。可选地,对比报表的方法,其特征在于,所述预定义规则包括:当所述单元格中包含的所述数据指示为所述行标题或者所述列标题时,基于预定义的词汇对应表进行对比。可选地,对比报表的方法,其特征在于,所述预定义规则还包括:当所述单元格中包含的所述数据指示为数字时,在对比所述数字前处理所述数字的数字表达形式,并基于相同的所述数字表达形式进行对比。可选地,对比报表的方法,其特征在于,标记所述至少两个报表中所包含的数据不一致的所述单元格。为实现上述目的,根据本专利技术实施例的第二方面,提供了一种对比报表的装置,其特征在于,包括:报表提取模块、行列获取模块和数据对比模块;其中,所述报表提取模块,用于从包含报表的文件中提取待对比的至少两个报表;所述行列获取模块,用于获取所述报表中单元格所在的行数和列数;所述数据对比模块,用于对比至少两个报表中相同行数和列数对应的单元格所包含的内容。可选地,所述对比报表的装置,其特征在于,确定至少两个所述报表具有相同的所述行数、所述列数以及相同的格式;所述格式指示所述报表包含行标题,列标题和数据。可选地,所述对比报表的装置,其特征在于,所述预定义规则包括:当所述单元格中包含的所述数据指示为所述行标题或者所述列标题时,基于预定义的词汇对应表进行对比。可选地,所述对比报表的装置,其特征在于,所述预定义规则还包括:当所述单元格中包含的所述数据指示为数字时,在对比所述数字前处理所述数字的数字表达形式,并基于相同的所述数字表达形式进行对比。可选地,所述对比报表的装置,其特征在于,标记所述至少两个报表中所包含的数据不一致的所述单元格。为实现上述目的,根据本专利技术实施例的第三方面,提供了一种对比报表的电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述对比报表的方法中任一所述的方法。为实现上述目的,根据本专利技术实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如上述视对比报表的方法中任一所述的方法。上述专利技术中的一个实施例具有如下优点或有益效果:从包含报表的文件中提取待对比的至少两个报表;获取所述报表中单元格所在的行数和列数;对比至少两个报表中相同行数和列数所对应的所述单元格中包含的内容。由此可以看出,本专利技术的本实施例能够不依赖自然语言处理方法和人工对比操作,快速且较为准确地对多版本定期报告中的报表进行对比,提高了对比报表的效率,减少了对比报表的工作量。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是本专利技术一个实施例提供的一种对比报表的方法的流程示意图;图2是本专利技术一个实施例提供的一种获取报表单元格信息的方法的流程示意图;图3是本专利技术一个实施例提供的一种对比报表的方法的流程图;图4是本专利技术一个实施例提供的简体中文报表的示意图;图5是本专利技术一个实施例提供的繁体中文报表的示意图;图6是本专利技术一个实施例提供的英文报表的示意图;图7是本专利技术一个实施例提供的一种对比报表装置的结构示意图;图8是本专利技术实施例可以应用于其中的示例性系统架构图;图9是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。如图1所示,本专利技术实施例提供了一种对比报表的方法,该方法包括以下步骤:步骤S101:从包含报表的文件中提取待对比的至少两个报表。具体地,从包含报表的文件中提取待对比的至少两个报表,以某公司的年报为例,通常年报除了报表还包含文字描述,因此,在进行对比报表的数据之前,需要把报表从文件中提取出来;例如,从不同语言版本的同类文件中,提取出至少两个报表进行对比;提取报表可以利用以下方法:第一种方法:利用软件从包含报表的文件中提取报表,比如利用VBA、python、c#、java等软件编写程序实现从包含报表的文件中提取出报表;第二种方法:利用人工结合软件的方式从包含报表的文件中提取报表;包括从不同语言版本的文件中提取相同格式的报表。具体地,首先对于不同版本的文件进行人工查阅,并进行页数上的一致性比对,如果发现页数不一致,需要运用分页符、制表符等工具人工进行调整至相同页数,且保证报表在同一页中。例如,由于中文和英文描述的简洁性不同,某个章节在中文年报中是4页,在英文年报中是3页。此时需要在英文年报中插入相应的分页符,保证页数也为4页,且报表位置与中文一致;然后利用软件,例本文档来自技高网...

【技术保护点】
1.一种对比报表的方法,其特征在于,包括:/n从包含报表的文件中提取待对比的至少两个报表;/n获取所述报表中单元格所在的行数和列数以及所述单元格包含的数据;/n基于预定义规则,对比至少两个报表中相同行数和相同列数所对应的所述单元格中包含的所述数据。/n

【技术特征摘要】
1.一种对比报表的方法,其特征在于,包括:
从包含报表的文件中提取待对比的至少两个报表;
获取所述报表中单元格所在的行数和列数以及所述单元格包含的数据;
基于预定义规则,对比至少两个报表中相同行数和相同列数所对应的所述单元格中包含的所述数据。


2.根据权利要求1所述的方法,其特征在于,
确定至少两个所述报表具有相同的所述行数、所述列数以及相同的格式;所述格式指示为所述报表中包含行标题,列标题和数据。


3.根据权利要求2所述的方法,其特征在于,
所述预定义规则包括:当所述单元格中包含的所述数据指示为所述行标题或者所述列标题时,基于预定义的词汇对应表进行对比。


4.根据权利要求3所述的方法,其特征在于,
所述预定义规则还包括:当所述单元格中包含的所述数据指示为数字时,在对比所述数字前处理所述数字的数字表达形式,并基于相同的所述数字表达形式进行对比。


5.根据权利要求1-4任一所述的方法,其特征在于,
标记所述至少两个报表中所包含的数据不一致的所述单元格。


6.一种对比报表的装置,其特征在于,包括:报表提取模块、行列获取模块和数据对比模块;其中,所述报表提取模块,用于从包含报表的文件中提取待对比的至少两个报表;
所述单元格获取模块,用于获取所述报表中单元格所在的行数和列数以及所...

【专利技术属性】
技术研发人员:林晨陈文极林震宇徐立宇林智泓陶峥田浩赵亮王金哲
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1