一种多渠道发票数据聚合处理方法技术

技术编号:37151209 阅读:13 留言:0更新日期:2023-04-06 22:07
本发明专利技术公开了一种多渠道发票数据聚合处理方法,属于无线定位方法技术领域,尤其涉及基于半监督的流形协同学习SMOL的聚合处理方法及系统,包括数据准备阶段、数据训练阶段、数据定位阶段,本发明专利技术解决现有技术存在由于缺少精确的回归函数的训练与预测模型,从而导致定位精确度低的问题,本发明专利技术涉及的回归函数,能够融合蓝牙与WiFi数据参与训练,具有提高了回归函数的训练与预测精度,大大提高单纯WiFi数据的定位精确度的有益技术效果。据的定位精确度的有益技术效果。据的定位精确度的有益技术效果。

【技术实现步骤摘要】
一种多渠道发票数据聚合处理方法


[0001]本专利技术属于数据处理方法
,尤其涉及一种多渠道发票数据聚合处理方法。

技术介绍

[0002]一般的发票数据处理系统,视角都关注在开票过程或者业务处理过程,随着电子发票的推广及金税四期全电业务的展开,依托于发票数据的业务场景和业务系统往往需要整合不同渠道不同来源的发票,形成全场景、全环节的数字化发票管理,打破不同渠道来源数据的信息化“横向隔离”,推动企业财务数据“纵向耦合”,打造泛在可及、智慧便捷的企业数据治理体系,使发票数据治理能更好地实现企业财务数字化建设目标;
[0003]现有发票数据的处理方法,是通过发票管理系统从认证系统或EXCEL模版导入用户的发票数据,根据从认证系统或EXCEL模版导入的用户的发票数据确定所述发票数据报表中未认证的发票,并根据预设的发票认证条件,确认所述未认证发票是否进行发票认证;若满足预设条件,则进行发票认证,并对经过认证的发票进行记账处理;
[0004]通过以上对于此专利公开的发票处理方法进行分析,此种方法获取发票渠道单一,用户在第三方财务软件的发票信息和移动端的发票信息不能方便及时的导入系统进行入账分析,用户需要把非系统开具的发票数据处理成EXCEL文件后才可以处理,加大了用户的工作量,
[0005]在发票数据的处理的需求,可以同时处理用户来自不同渠道开具和接收的发票数据,诸如系统界面保存的发票数据、第三方接口获取的发票数据、OCR识别的发票数据和EXCEL批量导入的发票数据等,用户可以方便快捷的对企业发票数据进行聚合处理;
[0006]综上所述,现有技术存在由于发票数据处理系统,视角都关注在开票过程或者业务处理过程,从而导致发票数据采集方式单一,与业务系统耦合度高,人工参与介入的场景偏多,可扩展性较低,运维成本较高的问题。

技术实现思路

[0007]本专利技术提供一种多渠道发票数据聚合处理方法,以解决上述
技术介绍
中提出了现有技术存在由于发票数据处理系统,视角都关注在开票过程或者业务处理过程,从而导致发票数据采集方式单一,与业务系统耦合度高,人工参与介入的场景偏多,可扩展性较低,运维成本较高的问题。
[0008]本专利技术所解决的技术问题采用以下技术方案来实现:
[0009]一种多渠道发票数据聚合处理方法,包括:
[0010]多渠道原始发票数据接入:基于不同渠道来源的发票数据,通过大数据聚合处理,输出标准的结构化发票数据;
[0011]原始发票数据适配:基于标准的结构化发票数据,通过统一适配处理,输出统一抽象发票数据;
[0012]发票数据标准化:基于统一抽象发票数据,通过配置不同的转换规则,输出标准化发票数据;
[0013]发票数据校验落地:基于标准化发票数据,通过发票校验处理,输出校验合格发票数据,并落入数据湖中形成落地应用发票数据;
[0014]发票数据对接应用:将落地应用发票数据接入统一的数据应用程序API接口。
[0015]进一步,所述多渠道原始发票数据接入还包括:
[0016]所述原始发票数据接入渠道包括如界面录入、EXCEL批量导入、第三方接口导入、图像识别OCR导入、发票二维码识别导入以及快速扩展接入。
[0017]进一步,所述原始发票数据包括:纯文本格式、XML格式、JSON格式、Excel格式。
[0018]进一步,所原始发票数据适配还包括:
[0019]基于每一个不同渠道的原始发票数据,设置相应的数据转换适配器,并通过相应的数据转换适配器适配处理,转换为统一抽象发票数据。
[0020]进一步,所述数据转换适配器适配处理包括:
[0021]基于抽象出统一发票数据结构,通过开源数据湖框架Hudi做数据存储方案,依托于消息队解耦进行数据采集的每一个不同渠道的原始发票数据,通过Flink侧输出流Side Output的分流操作,同步进行原始数据保存及数据处理。
[0022]进一步,所述发票数据标准化还包括:
[0023]基于统一抽象发票数据和解析预定义的转换规则,通过数据标准化处理,对等转换以匹配统一的标准化发票数据;
[0024]所述数据标准化处理包括:
[0025]通过解析预定义的转换规则,实例化Easy Rules规则引擎进行数据标准化处理,对数据字段名、内容格式等进行转换以匹配统一的抽象数据结构。
[0026]进一步,所述实例化Easy Rules规则引擎进行数据标准化处理包括:
[0027]基于原始文本数据,通过EasyRule转换规则引擎转换XML数据处理,转换为xmlElement对象;
[0028]读入EasyRule转换规则配置;
[0029]通过自定义的EasyRule规则引擎的实例化对象,将原始文本数据的属性与配置的规则进行操作比对,按照配置进行数据转换,产出标准JSON对象,转换结束后的标准JSON对象,可以落地或者重新赋值到对应实体后进行后续操作。
[0030]进一步,所述发票数据校验落地还包括:
[0031]发票数据校验处理:
[0032]基于标准化发票数据,通过:
[0033]筛选去重专项优化:通过发票代码、发票号码的关键字检索,删除重复的发票数据;
[0034]清洗验真专项优化:通过调用税局官方的接口,查验发票数据有效性;
[0035]专项优化后,汇总为校验合格发票数据。
[0036]进一步,所述发票数据校验落地还包括:
[0037]发票数据落地处理:
[0038]基于校验合格发票数据,通过开源数据湖框架的Hudi存入Hadoop大数据处理中间
件,存储于企业发票数据湖中。
[0039]进一步,所述发票数据对接应用还包括:
[0040]基于发票数据湖中的发票数据;
[0041]数据接入处理:通过数据湖中统一的API接口接入校验合格发票数据;
[0042]数据服务处理:通过Spring框架的Boot开发的标准化接口对外提供数据服务。
[0043]有益技术效果:
[0044]本专利采用多渠道原始发票数据接入:基于不同渠道来源的发票数据,通过大数据聚合处理,输出标准的结构化发票数据;原始发票数据适配:基于标准的结构化发票数据,通过统一适配处理,输出统一抽象发票数据;发票数据标准化:基于统一抽象发票数据,通过配置不同的转换规则,输出标准化发票数据;发票数据校验落地:基于标准化发票数据,通过发票校验处理,输出校验合格发票数据,并落入数据湖中形成落地应用发票数据;发票数据对接应用:将落地应用发票数据接入统一的数据应用程序API接口,由于在于将不同渠道的发票数据统一接入,通过大数据相关技术对不同渠道来源的发票数据进行聚合处理,产出标准的结构化数据。对于数据接入层,使用适配器设计模式,为不同的发票数据来源渠道提供统一的适配接口,针对每一个渠道来源数据只需要扩展相应的实现适配器即可快捷方便的将数据接入本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多渠道发票数据聚合处理方法,其特征在于,包括:多渠道原始发票数据接入:基于不同渠道来源的发票数据,通过大数据聚合处理,输出标准的结构化发票数据;原始发票数据适配:基于标准的结构化发票数据,通过统一适配处理,输出统一抽象发票数据;发票数据标准化:基于统一抽象发票数据,通过配置不同的转换规则,输出标准化发票数据;发票数据校验落地:基于标准化发票数据,通过发票校验处理,输出校验合格发票数据,并落入数据湖中形成落地应用发票数据;发票数据对接应用:将落地应用发票数据接入统一的数据应用程序API接口。2.根据权利要求1所述聚合处理方法,其特征在于,所述多渠道原始发票数据接入还包括:所述原始发票数据接入渠道包括如界面录入、EXCEL批量导入、第三方接口导入、图像识别OCR导入、发票二维码识别导入以及快速扩展接入。3.根据权利要求2所述聚合处理方法,其特征在于,所述原始发票数据包括:纯文本格式、XML格式、JSON格式、Excel格式。4.根据权利要求1所述聚合处理方法,其特征在于,所原始发票数据适配还包括:基于每一个不同渠道的原始发票数据,设置相应的数据转换适配器,并通过相应的数据转换适配器适配处理,转换为统一抽象发票数据。5.根据权利要求4所述聚合处理方法,其特征在于,所述数据转换适配器适配处理包括:基于抽象出统一发票数据结构,通过开源数据湖框架Hudi做数据存储方案,依托于消息队解耦进行数据采集的每一个不同渠道的原始发票数据,通过Flink侧输出流Side Output的分流操作,同步进行原始数据保存及数据处理。6.根据权利要求1所述聚合处理方法,其特征在于,所述发票数据标准化还包括:基于统一抽象发票数据和解析预定义的转换规则,...

【专利技术属性】
技术研发人员:孙飞刘佳敏李力伟林震王鹏吴立军
申请(专利权)人:内蒙古航天信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1