基于机器学习模型的单据生成凭证方法及设备技术

技术编号:23892357 阅读:19 留言:0更新日期:2020-04-22 06:59
本申请涉及一种基于机器学习模型的单据生成凭证方法,将待处理单据数据输入对应的模板匹配度模型,得到待处理单据数据的业务类别,及业务类别对应的专用处理模板,专用处理模板用来处理对应的业务类别的待处理单据数据,生成凭证数据。上述处理过程中,通过机器学习模型完成了业务人员对待处理单据数据进行分类并寻找处理单据数据的方法的过程;并通过预设的专用处理模板对待处理单据数据进行处理,生成凭证数据,代替了业务人员手动处理单据数据的过程。本申请中通过机械操作代替人工操作,实现了无人值守,自动完成业务分类,自动处理业务的过程,加快了对单据数据处理的速度,节省了人力资源。

The method and equipment of voucher generation based on machine learning model

【技术实现步骤摘要】
基于机器学习模型的单据生成凭证方法及设备
本申请涉及单据数据处理
,尤其涉及一种基于机器学习模型的单据生成凭证方法及设备。
技术介绍
现有技术中,手工记账需要业务人员通过原始纸质单据判断业务内容,再根据专业知识把单据内容转化成凭证分录并录入系统。手工通过单据录入凭证,需要业务人员充分理解单据所对应的业务类型,不仅无法快速处理多个单据,还浪费了人力。
技术实现思路
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种基于机器学习模型的单据生成凭证方法及设备。本申请的方案如下:根据本申请实施例的第一方面,提供一种基于机器学习模型的单据生成凭证方法,包括:获取待处理单据数据;根据所述待处理单据数据,基于所述待处理单据数据对应的模板匹配度模型,得到所述待处理单据数据的业务类别,及所述业务类别对应的专用处理模板;基于所述专用处理模板对所述待处理单据数据进行处理,生成凭证数据。优选的,在本申请一种可实现的方式中,还包括:获取历史单据数据作为样本数据;通过聚类方法对所述样本数据进行聚类,得到不同业务类别的样本数据;确定各个业务类别与预设的专用处理模板的对应关系,以根据不同业务类别的样本数据及业务类别对应的专用处理模板,建立所述模板匹配度模型。优选的,在本申请一种可实现的方式中,还包括:确定所述样本数据对通用可处理数据的置信度;以根据所述样本数据及所述样本数据对所述通用可处理数据的置信度,建立所述模板匹配度模型。优选的,在本申请一种可实现的方式中,还包括:根据所述待处理单据数据,基于所述待处理单据数据对应的模板匹配度模型,得到所述待处理单据数据对所述通用可处理数据的置信度;所述基于所述专用处理模板对所述待处理单据数据进行处理,生成凭证数据,具体包括:在所述待处理单据数据对所述通用可处理数据的置信度高于预设阈值时,基于所述待处理单据数据的业务类别对应的专用处理模板对所述待处理单据数据进行处理,生成凭证数据。优选的,在本申请一种可实现的方式中,还包括:在所述待处理单据数据对所述通用可处理数据的置信度低于预设阈值时,通过预设的算法分析所述置信度低于预设阈值的异常原因,并将所述异常原因进行上报。优选的,在本申请一种可实现的方式中,还包括:判断所述凭证数据是否合规,并在所述凭证数据不合规时进行上报。优选的,在本申请一种可实现的方式中,还包括:在所述待处理单据数据对所述通用可处理数据的置信度低于预设阈值时,向用户发送无法处理此类业务的信息。优选的,在本申请一种可实现的方式中,所述待处理单据数据具有多个数值项;所述基于所述专用处理模板对所述待处理单据数据进行处理,生成凭证数据,具体包括:通过预设的模板解析器对所述专用处理模板进行解析,得到所述专用处理模板中与所述待处理单据数据各个数值项对应的计算式;执行所述计算式,对所述待处理单据数据的各个数值项进行计算,得到所述凭证数据。优选的,在本申请一种可实现的方式中,还包括:在根据所述待处理单据数据生成凭证数据时,将所述待处理单据数据标记为已处理业务并存入数据库;在所述待处理单据数据对所述通用可处理数据的置信度低于预设阈值时,将所述待处理单据数据标记为暂不支持业务并存入数据库;接收业务人员上传的新增处理模板;接收业务人员对所述专用处理模板进行调整后生成的调整处理模板;基于所述新增处理模板或所述调整处理模板对被标记为暂不支持业务的所述待处理单据数据进行处理,生成凭证数据。根据本申请实施例的第二方面,提供一种基于机器学习模型的单据生成凭证设备,包括:处理器和存储器;所述处理器与存储器通过通信总线相连接:其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序至少用于执行以上任一项所述的基于机器学习模型的单据生成凭证方法。本申请提供的技术方案可以包括以下有益效果:本申请中,获取待处理单据数据,将待处理单据数据输入对应的模板匹配度模型,得到待处理单据数据的业务类别,及业务类别对应的专用处理模板,专用处理模板用来处理对应的业务类别的待处理单据数据,生成凭证数据。上述处理过程中,通过机器学习模型完成了业务人员对待处理单据数据进行分类并寻找处理单据数据的方法的过程;并通过预设的专用处理模板对待处理单据数据进行处理,生成凭证数据,代替了业务人员手动处理单据数据的过程。本申请中通过机械操作代替人工操作,实现了无人值守,自动完成业务分类,自动处理业务的过程,加快了对单据数据处理的速度,节省了人力资源。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。图1是本申请一个实施例提供的基于机器学习模型的单据生成凭证方法流程图;图2是本申请一个实施例提供的基于机器学习模型的单据生成凭证方法中建立模板匹配度模型的流程图;图3是本申请另一个实施例提供的基于机器学习模型的单据生成凭证方法流程图;图4是本申请一个实施例提供的基于机器学习模型的单据生成凭证设备结构图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。图1是本申请一个实施例提供的基于机器学习模型的单据生成凭证方法流程图,参照图1-图3,一种基于机器学习模型的单据生成凭证方法,包括:S11:获取待处理单据数据;待处理单据数据可以是用户在业务人员提供的终端设备中录入的电子单据数据,终端设备可以是台式电脑,平板电脑等。也可以是其他系统通过接口导入的单据数据。也可以是通过图形图像识别功能识别的纸质单据数据。S12:根据待处理单据数据,基于待处理单据数据对应的模板匹配度模型,得到待处理单据数据的业务类别,及业务类别对应的专用处理模板;单据数据一般包括销售发票单据、采购发票单据、费用发票单据、银行收款回单、银行付款回单等业务类别。根据实际业务发生的纸质凭证计入对应科目中。如:公司卖商品给客户开的发票,按业务规则需要计入销售单据,对应科目为主营业务收入。公司购买原材料获取的发票,按业务规则计入采购单据,对应的科目为库存商品等。模板匹配度模型是通过如下步骤建立的,参照图2:S21:获取历史单据数据作为样本数据;S22:通过聚类方法对样本数据进行聚类,得到不同业务类别的样本数据;业务类别即销售发票单据、本文档来自技高网...

【技术保护点】
1.一种基于机器学习模型的单据生成凭证方法,其特征在于,包括:/n获取待处理单据数据;/n根据所述待处理单据数据,基于所述待处理单据数据对应的模板匹配度模型,得到所述待处理单据数据的业务类别,及所述业务类别对应的专用处理模板;/n基于所述专用处理模板对所述待处理单据数据进行处理,生成凭证数据。/n

【技术特征摘要】
1.一种基于机器学习模型的单据生成凭证方法,其特征在于,包括:
获取待处理单据数据;
根据所述待处理单据数据,基于所述待处理单据数据对应的模板匹配度模型,得到所述待处理单据数据的业务类别,及所述业务类别对应的专用处理模板;
基于所述专用处理模板对所述待处理单据数据进行处理,生成凭证数据。


2.根据权利要求1所述的方法,其特征在于,还包括:
获取历史单据数据作为样本数据;
通过聚类方法对所述样本数据进行聚类,得到不同业务类别的样本数据;
确定各个业务类别与预设的专用处理模板的对应关系,以根据不同业务类别的样本数据及业务类别对应的专用处理模板,建立所述模板匹配度模型。


3.根据权利要求2所述的方法,其特征在于,还包括:
确定所述样本数据对通用可处理数据的置信度;以根据所述样本数据及所述样本数据对所述通用可处理数据的置信度,建立所述模板匹配度模型。


4.根据权利要求3所述的方法,其特征在于,还包括:
根据所述待处理单据数据,基于所述待处理单据数据对应的模板匹配度模型,得到所述待处理单据数据对所述通用可处理数据的置信度;
所述基于所述专用处理模板对所述待处理单据数据进行处理,生成凭证数据,具体包括:
在所述待处理单据数据对所述通用可处理数据的置信度高于预设阈值时,基于所述待处理单据数据的业务类别对应的专用处理模板对所述待处理单据数据进行处理,生成凭证数据。


5.根据权利要求4所述的方法,其特征在于,还包括:
在所述待处理单据数据对所述通用可处理数据的置信度低于预设阈值时,通过预设的算法分析所述置信度低于预设阈值的异常原因,并将所述异常原因进行上报。


6...

【专利技术属性】
技术研发人员:张述刚黄经海林云婷
申请(专利权)人:北京公瑾科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1