一种第三方涉税信息采集与分析利用工具制造技术

技术编号:11642245 阅读:79 留言:0更新日期:2015-06-24 19:36
本发明专利技术公开了一种第三方涉税信息采集与分析利用工具,通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;通过数据质量控制模型和工具实现采集数据的清洗与加工;通过数据关联模型实现数据与纳税人登记信息关联;通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。本发明专利技术提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的。

【技术实现步骤摘要】

本专利技术涉及处理第三方涉税信息抽取、清洗、关联、利用工具的领域,具体涉及一种第三方涉税信息采集与分析利用工具,对第三方涉税信息不对称性、广泛多样性有很好的处理结果,适用于政府部门之间涉税数据共享、大量涉税数据分析利用产生有价值的税源信息的应用场景。
技术介绍
随着经济社会的转型和信息技术发展,大量的行政、事业单位内包含有大量有价值的涉税信息,比如,工商、社保、交通、国土等部门,由于不同单位间的信息系统成为一个个信息孤岛,这些信息对于税务部门来说都没有得到有效的应用。如何充分利用第三方涉税信息资源,破解税收征管难题,进一步提高税源监控管理水平,切实起到堵漏增收,营造公平、公正、透明的税收发展环境有着积极而重要的意义。目前通用的采集工具,用户使用较为复杂,不能切实贴近税务系统,且采集的信息未得到有效的分析利用。第三方涉税信息采集与分析利用工具为以上问题提出了解决的方法,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的。此数据交换工具既节省用户学习抽取工具的时间,又可以很好、很快捷的完成数据交换,又节约了项目的成本。
技术实现思路
本专利技术的目的是:本专利技术专利提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发。本专利技术要解决的技术问题是: 1)数据采集工具问题,技术门槛高,需要专业的技能;数据量大,数据采集需要占用大量的服务器资源; 2)数据的清洗加工过程复杂,需清洗出高质量的结构化数据; 3)数据关联过程复杂多样,需多种关联模型,关联出有效的数据; 4)数据的派发反馈过程多变,需可配置流程。本专利技术所采用的技术方案为: 一种第三方涉税信息采集与分析利用工具,所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类; 通过数据质量控制模型和工具实现采集数据的清洗与加工; 通过数据关联模型实现数据与纳税人登记信息关联; 通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。整个信息处理过程通过监控引擎进行记录,能够在监控日志、异常预警、预警展示中对处理过程进行处理。所述工具操作流程如下: 1)采集数据前需确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型; 2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入; 3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理; 4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改; 5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员; 6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。本专利技术的有益效果为:本专利技术专利提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的,既节省用户学习抽取工具的时间,又可以很好、很快捷的完成数据交换,又节约了项目的成本。【附图说明】图1为本专利技术总体架构示意图; 图2为本专利技术总体流程图。【具体实施方式】下面通过【具体实施方式】对本专利技术进一步说明: 实施例1: 一种第三方涉税信息采集与分析利用工具,所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;通过配置管理对数据源、抽数表对象及抽数规则进行配置定义,使用定时器引擎(提供数据层、应用层接口),调用抽数引擎(支持复杂的抽数处理规则),完成数据的采集过程; 通过数据质量控制模型和工具实现采集数据的清洗与加工;运用多种数据清洗工具,通过内置数据计算功能,自动调度等实现数据的清洗过程; 通过数据关联模型实现数据与纳税人登记信息关联;运用数据关联模型,在目标与户籍信息中建立映射关系库,通过组织机构代码或识别号等多种方式实现数据关联; 通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用; 数据派发反馈过程引入轻量工作流,实现派发的流程可配置。实施例2: 在实施例1的基础上,本实施例整个信息处理过程通过监控引擎进行记录,能在监控日志、异常预警、预警展示中对处理过程进行处理。实施例3: 如图2所示,在实施例1或2的基础上,本实施例所述工具操作流程如下: 1)采集数据前需确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型; 2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入; 3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理; 4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改; 5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员; 6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。以上实施方式仅用于说明本专利技术,而并非对本专利技术的限制,有关
的普通技术人员,在不脱离本专利技术的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本专利技术的范畴,本专利技术的专利保护范围应由权利要求限定。【主权项】1.一种第三方涉税信息采集与分析利用工具,其特征在于:所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类; 通过数据质量控制模型和工具实现采集数据的清洗与加工; 通过数据关联模型实现数据与纳税人登记信息关联; 通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。2.根据权利要求1所述的一种第三方涉税信息采集与分析利用工具,其特征在于:整个信息处理过程通过监控引擎进行记录,能够在监控日志、异常预警、预警展示中对处理过程进行处理。3.根据权利要求1或2所述的一种第三方涉税信息采集与分析利用工具,其特征在于,所述工具操作流程如下: 1)采集数据前确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型; 2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入; 3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理; 4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改; 5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员; 6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。【专利摘要】本发本文档来自技高网
...

【技术保护点】
一种第三方涉税信息采集与分析利用工具,其特征在于:所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;通过数据质量控制模型和工具实现采集数据的清洗与加工;通过数据关联模型实现数据与纳税人登记信息关联;通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。

【技术特征摘要】

【专利技术属性】
技术研发人员:李俊峰邹建军
申请(专利权)人:浪潮软件集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1