【技术实现步骤摘要】
一种单据解析方法及系统
[0001]本专利技术涉及发票数据处理
,并且更具体地,涉及一种单据解析方法及系统。
技术介绍
[0002]很多软件系统都不是孤立的,可能存在不同的软件系统之间需要做数据对接,系统间对接的形式有很多种,比如通过API、数据库、单据等形式。通过系统间的业务数据交互来完成某项业务处理。
[0003]例如,CN201710980604.0提供了一种业务数据的导入方法、装置和计算机设备。描述了一种业务数据导入方法,循环读取业务单据数据后,根据每个列的列名,获取数据维度,再根据数据维度与多维数据维度之间的映射关系,将单据数据映射为一种多维数据的方案。CN201910604334.2涉及业务过程优化
,具体公开了一种单据信息的处理方法、处理装置及相关产品,描述了一种针对单据批改所做的单据导入方法,接收批改单据请求,获取导入列的校验规则做合法性校验,从数据库读取原始单据,根据导入的批改请求单据对原始单据做批改操作。
[0004]但是,如何实现发票的快速解析是急需解决的问题。因此,需要一种 ...
【技术保护点】
【技术特征摘要】
1.一种单据解析方法,其特征在于,所述方法包括:获取待解析的至少一条目标单据文件,并创建每条目标单据文件的文件标识;按照预设的导入文本格式规则对所述至少一条目标单据文件中的每条目标单据文件进行格式转换,以获取至少一条文本文件数据,并建立每条文本文件数据和对应的目标单据文件和文件标识之间的第一关联关系;按照文件标识,依次对每条文本文件数据进行读取和解析,以获取每套文本文件数据对应的解析数据,并建立每个文件标识和对应的解析数据之间的第二关联关系;基于所述第一关联关系和第二关联关系,确定每条目标单据文件对应的解析数据并保存至数据库。2.根据权利要求1所述的方法,其特征在于,所述方法采用批量或单条获取数据的方式从预设文件或存储设备中导入待解析的至少一条目标单据文件。3.根据权利要求1所述的方法,其特征在于,所述预设的导入文本格式规则,包括:设置分隔符为“~~”;设置注释行的开头为“//”;设置不同单据种类的标识;设置发票票面字段在文本文件数据中对应位置的含义,包括:“单据编号~~商品明细数量~~购方名称~~购方税号~~其他”;设置发票对应的商品明细字段在文本文件中对应位置的含义,包括:“商品名称~~规格型号~~计量单位~~数量~~单价~~金额~~税率~~税额~~其他”。4.根据权利要求1所述的方法,其特征在于,所述依次对每条文本文件数据进行读取和解析,以获取每套文本文件数据对应的解析数据,包括:将任一条文本文件数据逐行读入内存,读入过程中,过滤注释行、空行;读取单据种类标识,用于确定单据的种类,再按照对应单据种类所约定的格式解析单据,包括:获取第1行数据,解析为“单据种类标识”;获取第2行的发票票面数据,使用“~~”作为分隔符,将此行数据做分割,按照格式约定,分割后的第1、2、3、4位置对应的数据值分别代表:单据编号、商品明细数量、购方名称、购方税号;根据解析得到的“商品明细数量”的值,确定后续对应发票的商品明细的行数;读取对应数量的商品行,每行数据使用“~~”作为分隔符并做分隔,按照格式约定,分割后的第1到8位置对应的数据值分别代表:商品名称、规格型号、计量单位、数量、单价、金额、税率、税额。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:对于任一条文本文件数据,当解析过程中数据格式不正确时,返回包含该任一条文本文件数据对应的文件标识的错误信息,并直接跳转至下一条文本文件数据的解析过程。6.一种单据解析方法,其特征在于,所述系统包括:数据获取单元,用于...
【专利技术属性】
技术研发人员:郭尚坤,魏贺生,单国军,周晚晴,谢宇,
申请(专利权)人:航天信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。