The invention discloses a large tax data system without server FaaS structure, which comprises a client, a processing system, an API gateway, an extraction system and a HDFS connected sequentially; and the processing system comprises a VAT invoice data processing module, a general invoice data processing module, an electronic invoice data processing module, a commodity classification processing module, and a data processing module. The system includes VAT invoice data extraction module, general invoice data extraction module, electronic invoice data extraction module, commodity classification information extraction module, purchase and sale information extraction module. The invention does not need to re-create wheels any more, what functions need to be directly integrated and invoked, nor does it need to consider the overall performance, but only focuses on the implementation of business code; based on container technology, it is easier to expand horizontally; automatic flexible expansion, reduces the complexity of packaging and deployment, and can be quickly released online; based on the container technology, it is easier to expand horizontally; Function, it is easier to find the BUG of the program and easier to solve BUG, and improve the efficiency of solving the problem.
【技术实现步骤摘要】
一种无服务器FaaS架构税务大数据系统
本专利技术属于大数据领域,尤其涉及一种无服务器FaaS架构税务大数据系统。
技术介绍
目前大数据项目开发整个流程是:开发人员必须手动在各个物理节点上安装大数据平台软件栈Hadoop、Hbase、Spark、Storm,Kafka等;开发人员通过各中脚本语言或编程语言(如Scala,Java,Shell等)开发ETL、机器学习;开发人员将编译后的代码打包成jar或war文件上传到服务器上,通过shell脚本、spark命令或应用服务器运行jar/war程序。但是大数据平台多为开源组件,版本多而杂,组件间及操作系统的依赖很重,平台的迁移和升级问题一直是开源软件最大的痛,集群规模的扩张和运维费时费力,严重影响工作效率;另一方面:大数据ETL开发,机器学习脚本多,语言多,同时又是海量数据,迭代计算,造成异常数据、异常处理困难重重,海量数据抽取和机器学习中迭代计算时经常发现OOM的问题或磁盘空间不足导致运行程序出错,造成开发人员必须重新申请资源或者通过删除历史日志等处理方法去解决问题,造成效率低下和重复工作。
技术实现思路
本专利技术的目的在于克服现有技术存在的以上问题,提供一种无服务器FaaS架构税务大数据系统,避免效率低下和重复工作。为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现:一种无服务器FaaS架构税务大数据系统,包括依次连接的客户端、处理系统、API网关、抽取系统、HDFS;所述处理系统包括增值税发票数据处理模块、普通发票数据处理模块、电子发票数据处理模块、商品分类处理模块、进销项处理模块;所述抽 ...
【技术保护点】
1.一种无服务器FaaS架构税务大数据系统,其特征在于:包括依次连接的客户端、处理系统、API网关、抽取系统、HDFS;所述处理系统包括增值税发票数据处理模块、普通发票数据处理模块、电子发票数据处理模块、商品分类处理模块、进销项处理模块;所述抽取系统包括增值税发票数据抽取模块、普通发票数据抽取模块、电子发票数据抽取模块、商品分类信息抽取模块、进销项信息抽取模块;所述增值税发票数据处理模块用于工作人员对来自客户端的增值税发票数据进行处理并发送至API网关;普通发票数据处理模块用于工作人员对来自客户端的普通发票数据进行处理,并形成增值税发票处理数据发送至API网关;电子发票数据处理模块用于工作人员对来自客户端的电子发票数据进行处理,并形成电子发票处理数据发送至API网关;商品分类处理模块用于工作人员对来自客户端的商品分类数据进行处理,并形成商品分类处理数据发送至API网关;进销项处理模块用于工作人员对来自客户端的进销项数据进行处理,并形成进销项处理数据发送至API网关;所述增值税发票数据抽取模块用于对API网关中的增值税发票处理数据进行抽取并发送至HDFS;普通发票数据抽取模块用于对API ...
【技术特征摘要】
1.一种无服务器FaaS架构税务大数据系统,其特征在于:包括依次连接的客户端、处理系统、API网关、抽取系统、HDFS;所述处理系统包括增值税发票数据处理模块、普通发票数据处理模块、电子发票数据处理模块、商品分类处理模块、进销项处理模块;所述抽取系统包括增值税发票数据抽取模块、普通发票数据抽取模块、电子发票数据抽取模块、商品分类信息抽取模块、进销项信息抽取模块;所述增值税发票数据处理模块用于工作人员对来自客户端的增值税发票数据进行处理并发送至API网关;普通发票数据处理模块用于工作人员对来自客户端的普通发票数据进行处理,并形成增值税发票处理数据发送至API网关;电子发票数据处理模块用于工作人员对来自客户端的电子发票数据进行处理,并形成电子发票处理数据发送至API网关;商品分类处理模块用于工作人员...
【专利技术属性】
技术研发人员:李海波,陆军,潘明文,
申请(专利权)人:安徽航天信息有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。