票据解析装置和税控系统制造方法及图纸

技术编号:8834762 阅读:165 留言:0更新日期:2013-06-22 20:49
本发明专利技术公开了一种票据解析装置和税控系统,其中,该票据解析装置包括:数据控制模块,用于接收原始数据,并采用环形缓存的存储方式将接收的原始数据进行保存;模板配置模块,用于载入预先配置的模板配置文件,并将模板配置文件转换为内存模板数据结构类型;元数据解析模块,用于根据模板配置模块载入的模板配置文件、对原始数据进行数据处理提取元数据。本发明专利技术具有识别速度快、准确性高、适应性强的特点。

【技术实现步骤摘要】

本专利技术涉及一种票据解析装置和税控系统
技术介绍
目前国内许多省份正在进行税控改造,其中在大型商业零售企业的税控改造升级中,直接使用税控收款机需要企业更换大量的原有POS机,甚至整个POS系统都需要变更,这为改造增加了极大的成本和代价。网络税控器是一种架设于POS机与小票打印机之间的税控设备,无需改变任何POS系统,只需要打印数据经过网络税控设备就可以达到税控的目的,网络税控器获取票据中的税控元数据生成税控码。这种方案就十分适合于商超基于原有POS机系统的税控改造升级,不仅成本低,而且可以准确无误的获取真实的税控数据。在这种税控改造的架构中,需要税控设备准确、同步、及时地输出打印数据以及税控发票信息,而不影响正常的POS机开票过程。准确地获取POS机发送出的票据数据,这是税控信息生成的原始数据;同步输出POS的打印数据,不影响票据数据的打印,不因税控设备处理数据而导致打印停滞;并且在票据数据获取完毕的同时,及时生成税控信息的元数据,直接进入发票信息生成环节,并输出打印税控信息。因此,需要一种新的票据解析技术已解决上述问题。
技术实现思路
为解决上述问题,本专利技术的主要目的在于提供一种票据解析装置和税控系统,其中:根据本专利技术实施例的票据解析装置包括:数据控制模块,用于接收原始数据,并采用环形缓存的存储方式将接收的原始数据进行保存;模板配置模块,用于载入预先配置的模板配置文件,并将模板配置文件转换为内存模板数据结构类型;元数据解析模块,用于根据模板配置模块载入的模板配置文件、对原始数据进行数据处理提取元数据。其中,数据控制模块用于管理原始数据的读数据的位置信息和写数据的位置信肩、O其中,数据控制模块为元数据解析模块提供原始数据的读数据的位置信息和写数据的位置信息,元数据解析模块以字节为单位从数据控制模块中连续地读取原始数据。其中,元数据解析模块根据有限自动机原理、并根据模板配置模块载入的模板配置文件,对原始数据进行数据处理提取元数据。其中,模板配置模块载入的模板配置文件至少包括:匹配字符列表、状态转换表、属性信息。其中,数据控制模块将接收的原始数据发送至接收装置;元数据解析模块与接收装置同步工作。根据本专利技术实施例的税控系统包括上述的票据解析装置。根据本专利技术的技术方案,通过根据配置模板配置文件、对原始数据进行数据处理从而提取元数据,本专利技术具有识别速度快、准确性高、适应性强的特点,并且票据解析装置可以独立于税控业务,重用度高。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术实施例的票据解析装置的应用场景的示意图;图2是本专利技术实施例的票据解析装置的结构框图;图3是本专利技术实施例的环形缓存的原理示意图;图4是本专利技术实施例的自动机的状态转换示意图。具体实施例方式在详细描述本专利技术之前,首先解释本文下文中出现的一些名词。(I)元数据:解析所需要提取的数据,如金额,时间等。(2)匹配字符:匹配的最小元素。只要状态需要,可以出现在任何一个状态中。(3)状态:解析过程的一个独立单元,能够达到一个状态意味着当前数据与该状态下的匹配字符集完全匹配。关键信息的获取就是以状态为单位,满足该状态的同时,完成信息的获取。(4)状态字符序列:由匹配字符构成,匹配时按照其先后顺序进行匹配。仅当完全匹配上此序列,则实现状态跳转,进入此状态,即状态匹配成功。(5)状态序列:状态匹配权重。当下一个状态可能有多个时,按照状态序列依次进行匹配,期间只要有状态匹配成功,则直接进入该状态。(6)起始状态:解析初始状态,必须存在。该状态只含有状态序列,没有匹配字符序列。(7)终止状态:解析结束状态,必须存在。该状态既没有状态序列,也没有匹配字符序列。自动机结束即状态转换以进入该状态。为使本专利技术的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本专利技术作进一步地详细说明。根据本专利技术的实施例,提供了 一种票据解析装置。如图1所示,该票据解析装置设置在输出装置和接收装置之间。具体地,输出装置可以是销售终端(P0S机),接收装置可以是小票打印机。票据解析装置获取POS机发送出的票据数据,这是税控信息生成的原始数据;在对原始数据进行数据解析的同时,向小票打印机同步输出POS机的打印数据,也就是输入票据的打印与解析是同步的,这样,既可以达到边打印边解析的目的,而且可以控制税控信息的输出位置。根据本专利技术实施例的票据解析过程包括:原始数据由硬件接口传入,将传入的原始数据采用环形缓存的存储方式,循环不断地保存传入的数据,并管理数据读写的位置信息。以字节为单位从环形缓存中连续读取数据,进入解析流程。在解析结束时,变更解析状态为完毕,监控程序得知结束后,根据元数据信息类型,使用元数据读取接口得到所需数据。本专利技术的技术方案旨在使用一种通用的模式识别方法,它使得识别具有高度适应的特点。在面对众多POS系统打印出的票样时,没有一种统一的全局适应的提取规则,同样语义的词语有许多,无法考虑到全部情况。因此,本方案引入解析模板的概念,这是票据数据识别的基础,整个识别的实现过程都是以此展开的。模板文件使解析可以不局限于某一种票据的票样,而是通过人工简单地配置即可定制出具有针对性的解析方案。从而达到无论企业的POS打印数据具有何种多样的票样,本方案都可适应其变化的目的。图2是本专利技术实施例的票据解析装置的结构框图,如图2所示,该装置包括:数据控制模块10、模板配置模块20、元数据解析模块30。数据控制模块10,用于接收原始数据,并采用环形缓存的存储方式将接收的原始数据进行保存。数据控制模块10采用环形缓存的存储方式实现票据数据的存储,作为解析数据读取的源数据区。数据控制模块就是负责管理环形缓存中数据的读写操作,记录位置信息,并为元数据解析模块提供字节流的读取位置。在硬件设备进行数据读取时,如采用串口通信方式,其数据传入时间具有不确定性,需要不断进行监听读取,并且一次传入的数据大小也不确定。而另一方面,解析程序是以字节流的方式处理,如果传入一个字节数据就进入解析处理,会导致频繁的IO操作,延缓了数据传入的速度。由于在实际环境中读写顺序具有不确定性,一次读写数据数目不确定,这些现象导致无法采用直接字节数据处理的方式。因此该数据控制模块管理一个足够大缓存,参考图3,可写入由串口一次传入的数据,同时读写各有一个位置标记,读标记(mark)和写标记(wmark),使得读写互不干扰。为保证数据读写的连续,使用环形存储方式,当读写到达缓存末端时,新的读写标记将回到缓存起始位置。由于缓存可以根据一次票据数据的大小设置得足够大,并且写入与读取是同步进行的,因此不会出现新数据覆盖还未读取数据的情况。模板配置模块20,用于载入预先配置的模板配置文件,并将模板配置文件转换为内存模板数据结构类型。模板配置子模块首先完成模板文件的载入,存储到内存中特定数据结构中,作为整个解析程序运行的全局模板配置数据区。配置文件的信息主要包括:匹配字符列表,状态转换表,属性信息。匹配字符列表存储解析的候选匹配关键字,状态转换表构成解析数据的路线图,属性信息用于记录匹配字符类型,元数据信息类型等辅助信息。根本文档来自技高网...

【技术保护点】
一种票据解析装置,该装置在输出装置和接收装置之间,其特征在于,所述票据解析装置包括:数据控制模块,用于接收原始数据,并采用环形缓存的存储方式将接收的所述原始数据进行保存;模板配置模块,用于载入预先配置的模板配置文件,并将所述模板配置文件转换为内存模板数据结构类型;元数据解析模块,用于根据所述模板配置模块载入的模板配置文件、对所述原始数据进行数据处理提取元数据。

【技术特征摘要】
1.一种票据解析装置,该装置在输出装置和接收装置之间,其特征在于,所述票据解析装置包括: 数据控制模块,用于接收原始数据,并采用环形缓存的存储方式将接收的所述原始数据进行保存; 模板配置模块,用于载入预先配置的模板配置文件,并将所述模板配置文件转换为内存模板数据结构类型; 元数据解析模块,用于根据所述模板配置模块载入的模板配置文件、对所述原始数据进行数据处理提取元数据。2.根据权利要求1所述的票据解析装置,其特征在于,所述数据控制模块用于管理所述原始数据的读数据的位置信息和写数据的位置信息。3.根据权利要求2所述的票据解析装置,其特征在于,所述数据控制模块为所述元数据解析模块提供所述原始数据的读数据的位...

【专利技术属性】
技术研发人员:高志刚廖峰王乾胡金辉陈磊张国喜赵轶民武志鹏孙国良
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1