一种数据处理规则生成方法、装置及电子设备制造方法及图纸

技术编号:26479150 阅读:22 留言:0更新日期:2020-11-25 19:23
本说明书实施例提供一种数据处理规则生成方法、装置及电子设备。所述方法包括:获取一个或多个目标报表,对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;确定成功匹配的关键字符所对应的文本信息以及该文本信息所对应的表头,根据所述数据处理规则生成策略建立该表头所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。本技术方案可以应用于监管领域,利用生成的数据处理规则可进一步实现对目标报表的合规检查。

【技术实现步骤摘要】
一种数据处理规则生成方法、装置及电子设备
本说明书涉及计算机
,尤其涉及一种数据处理规则生成方法、装置及电子设备。
技术介绍
随着网络和信息化技术的快速发展,各行各业对业务经营过程中所产生的数据进行管理和监督的需求越来越明显,报表是一种常用的对业务数据或经营数据进行收集、汇总的数据展示形式。由于同一报表内或不同报表之间的数据往往存在一些相关性,通过对这种相关关系进行深入挖掘生产出一定的规则,并利用这些规则对其他报表进行数据核验,从而能够发现报表中存在的一些问题,避免出现错报。现有技术中,通过采取人工对报表数据进行梳理的方式来发现报表数据间的数据处理规则,然后再对发现的数据处理规则进行人工验证。但是,由于报表的数据量往往比较大,不同报表之间的指标也不相同,因此通过人工方式生产数据处理规则的方式效率较低,更无法深入地推导出准确的规则,且生产出来的规则的可信度和有效性都比较差。
技术实现思路
本说明书实施例提供一种数据处理规则生成方法、装置及电子设备,以解决现有技术存在的数据处理规则生成效率较低,无法生成准确本文档来自技高网...

【技术保护点】
1.一种数据处理规则生成方法,所述方法包括:/n获取一个或多个目标报表,其中,所述目标报表为预定的目标报表模板所对应的样表或者对所述目标报表模板进行数据填写后生成的报表;/n对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;/n确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;/n确定成功匹配的关键字符所对应的文本信息以及所述成功匹配的关键字符所对应的文本信息的表头,根据所述数据处理规则生成策略建立所述成功匹配的关键字符所对应的文本信息的表头所属单元格之间的关联关系,并将所述...

【技术特征摘要】
1.一种数据处理规则生成方法,所述方法包括:
获取一个或多个目标报表,其中,所述目标报表为预定的目标报表模板所对应的样表或者对所述目标报表模板进行数据填写后生成的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;
确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;
确定成功匹配的关键字符所对应的文本信息以及所述成功匹配的关键字符所对应的文本信息的表头,根据所述数据处理规则生成策略建立所述成功匹配的关键字符所对应的文本信息的表头所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。


2.如权利要求1所述的方法,所述对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息,包括:
对所述目标报表中各个单元格的信息进行提取,得到所述单元格所对应的表头信息和所述表头信息对应的文本信息;
其中,所述表头信息包含所述单元格所对应的行头信息和列头信息,所述文本信息包含所述单元格的表头所对应的文本描述信息。


3.如权利要求2所述的方法,所述单元格包括待填写数据的空白单元格,所述确定所述单元格的表头所对应的文本信息中的关键字符,包括:
根据所述空白单元格所对应的行和列,确定所述行和列分别对应的文本描述信息,并根据预先设置的关键字符与所述文本描述信息进行匹配,确定所述文本描述信息中所包含的关键字符。


4.如权利要求2所述的方法,所述预设的数据处理规则生成策略,包括:
根据所述目标报表内部各单元格的行和列分别对应的文本描述信息,预先建立的所述单元格自身以及若干个单元格之间的数据处理规则生成策略。


5.如权利要求2所述的方法,所述根据所述数据处理规则生成策略建立所述成功匹配的关键字符所对应的文本信息的表头所属单元格之间的关联关系,包括:
根据所述数据处理规则生成策略中对应行和列的文本描述信息,以及成功匹配的文本信息所对应的行和列,建立所述行和列所对应单元格之间的关联关系;其中,所述行和列用于表示所述单元格在目标报表中的坐标。


6.一种数据处理规则生成方法,所述方法包括:
获取一个或多个目标报表,其中,所述目标报表包括根据预定的目标报表模板进行数据填写且已完成上报的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息;
根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作;
根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。


7.如权利要求6所述的方法,所述预定单元格包括用于填写数据的单元格,所述对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息,包括:
对所述目标报表中各个预定单元格的信息进行提取,得到所述预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息;
其中,所述数据信息包含根据目标报表模板所填写的业务数据;所述表头信息包含所述预定单元格所对应的行头信息和列头信息。


8.如权利要求6所述的方法,所述预设的数据处理规则生成策略包括比对策略和计算策略,所述根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作,包括:
根据所述比对策略将每个所述预定单元格所对应的数据信息与同一目标报表或不同目标报表中的其他预定单元格所对应的数据信息分别进行比对;
或者,
根据所述计算策略将每个所述预定单元格所对应的数据信息与同一目标报表或不同目标报表中的其他预定单元格所对应的数据信息分别进行计算,和/或,将每个所述预定单元格所对应的数据信息与同一目标报表或不同目标报表中的至少两个其他预定单元格所对应的数据信息一起进行计算。


9.如权利要求8所述的方法,所述根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,包括:
根据所述比对或计算操作的结果确定所述预定单元格与至少一个其他预定单元格之间的关联关系,从而根据具有关联关系的预定单元格,建立所述预定单元格的表头信息之间的关联关系。


10.一种数据处理规则生成方法,所述方法包括:
获取多个目标报表,其中,所述目标报表包括根据预定的目标报表模板和指标库进行数据填写后得到的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格所对应的指标信息和表头信息;
根据预设的数据处理规则生成策略对所述预定...

【专利技术属性】
技术研发人员:费宣
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1