基于人工智能的政府会计经济分类智能预测填报方法技术

技术编号:39568314 阅读:9 留言:0更新日期:2023-12-03 19:19
本发明专利技术涉及一种基于人工智能的政府会计经济分类智能预测填报方法,其技术特点是:从财务数据库中获取初始数据并进行数据预处理;创建训练模型并训练得到初始智能预测模型;基于初始智能预测模型,自动预测并填写对应的经济分类;定时获取最新的财务已制单凭证数据并增量更新数据集,优化智能预测模型;基于优化智能预测模型进行经济分类的预测;任务调度情况分析,分析模型训练结果的稳定性

【技术实现步骤摘要】
基于人工智能的政府会计经济分类智能预测填报方法


[0001]本专利技术属于信息
,涉及政府会计经济分类管理数据处理,尤其是一种基于人工智能的政府会计经济分类智能预测填报方法


技术介绍

[0002]政府会计经济分类对于全面

准确地反映政府的各项经济活动具有重要意义,其中支出经济分类更是其中的重要组成部分,反映了政府支出的经济性质和具体用途,因此,在日常经济业务的核算处理时,经济分类的准确填写至关重要

但是,在高校日常财务报销中,经济活动产生的各类发票

单据等原始票据及附件在人工填写报销单中的经济分类时遇到了诸多问题,如:无法及时获取或准确知悉各类报销政策和制度依据,在人工填报时存在经济事项判断错误等问题;经费来源种类多,支出业务复杂多样,各类经费管理政策很多并各有不同,同一经济业务在不同项目经费下所列支的经济分类也有所不同,报销人难以准确判断填写,增加了财务报销难度,由此带来的核算工作量和会计差错率也大大增加

[0003]针对上述人工填报的问题,现有的财务核算软件采用通过数据库查询语言直接查询数据库进行经济分类匹配的方式进行解决,但该方式仍存在以下问题:
[0004](1)
匹配的准确率低

数据库中的数据为原始数据,未进行加工处理,数据量大,查询速度慢;并且随着历年政策的不断调整变化,数据存储的要求也在更新,因此在查询时有效数据相对较少,无法准确匹配

[0005](2)
维护成本高

不同高校的经济业务和管理政策不尽相同,同一套查询语句无法在各高校进行重复应用;并且随着政策变化,已有的查询语句可能也无法适用,由此造成二次开发,大大增加了维护工作量和维护成本

[0006](3)
数据安全风险高

数据库存储了大量敏感数据,采用直接索引数据库的方式可能会造成数据泄露

数据篡改等安全性问题


技术实现思路

[0007]本专利技术的目的在于克服现有技术的不足,提供一种基于人工智能的政府会计经济分类智能预测填报方法,能够快速

准确

自动地根据发票内容和经费项目预测并填写对应的经济分类,并且可根据最新的财务数据实现模型的自动更新与优化功能

[0008]本专利技术解决现有的技术问题是采取以下技术方案实现的:
[0009]一种基于人工智能的政府会计经济分类智能预测填报方法,包括以下步骤:
[0010]步骤
1、
从财务数据库中获取初始数据并创建数据集,对数据集中的数据进行数据预处理;所述数据包括凭证分录中的发票内容

项目经费信息及经济分类;
[0011]步骤
2、
创建训练模型,选定待训练的数据集和所述数据集中待预测的目标数据列,运用深度学习算法和机器学习算法进行模型训练,完成训练后,使用验证集数据对训练好的模型进行验证并评估模型的性能,自动筛选训练结果最优的算法模型,生成最终的初始智能预测模型;
[0012]步骤
3、
基于初始智能预测模型,在填报报销单时根据上传的发票内容和选择的项目经费信息,自动预测并填写对应的经济分类,由财务审核通过后,将准确的发票信息

项目经费信息和经济分类信息存入财务数据库中,作为模型优化训练的增量数据进行使用;
[0013]步骤
4、
创建任务调度服务并定时获取最新的财务已制单凭证数据并增量更新数据集,根据更新后的数据集进行初始智能预测模型的自动实时训练,并不断迭代生成更新后的优化智能预测模型;
[0014]步骤
5、
再次报销时,基于优化智能预测模型进行经济分类的预测,并形成新的财务已制单凭证数据,当满足任务调度服务的触发条件后,转至步骤4,启动优化智能预测模型的自训练过程;
[0015]步骤
6、
任务调度情况分析,统计已启动自训练过程的智能预测模型的模型训练结果,并分析模型训练结果的稳定性

[0016]进一步,所述步骤1采用从接口服务导入方式或通过本地文件导入方式从账务数据库中获取初始数据

[0017]进一步,所述步骤1采用数据筛选

数据归并

数据补全

数据增强

数据转换和特征提取方法进行数据预处理;所述数据筛选是对原始数据进行筛选,过滤发票内容和经济分类为空值的无效数据;所述数据归并是对原始数据进行重复项合并,消除冗余,使样本特征更加明显;所述数据补全是对缺失的项目经费信息进行填充,通过数据增强对原始数据中单个经济分类数据较少的样本进行扩充,以增加训练样本的数据量;所述数据转换是将原始数据转换为适用于机器学习和深度学习模型的格式;所述特征提取是对发票内容进行词语特征提取,并转换成词向量,通过对发票内容进行分词,根据所有发票的内容,以及与每张发票相关联的经费项目和经济分类信息,创建背景语料库,运用
TF

IDF
方法评估单个词或者词组的重要性,分析在某个特定的经费项目或经济分类下哪些词或词组权重更高,并利用加权的词向量输入到模型中进行训练

[0018]进一步,所述待预测的目标数据列为经济分类列

[0019]进一步,所述步骤2在模型训练时,首先按预先设定的训练集和验证集数据比例,从整个数据集中抽取数据,然后同时运用深度学习算法和机器学习算法对训练集数据进行多轮训练,每轮训练过程中,模型根据训练数据的特征和标签进行参数调整,逐步优化模型的性能和预测能力

[0020]进一步,所述深度学习算法采用
LSTM
算法,所述机器学习算法包括
KNN
算法
、Softmax
算法和随机森林算法

[0021]进一步,所述步骤2对训练好的模型进行验证并评估的方法包括准确率评估
、F1

score
评估

精确率评估和召回率评估,通过准确率和混淆矩阵分析关注分类正确率较高且混淆较少的算法模型,并使用微平均的评估指标综合考虑每个算法模型的分类结果,得出总体的性能评估,以此筛选出训练结果最优的算法模型,生成最终的初始智能预测模型

[0022]进一步,所述步骤4自动实时训练的方法包括以下子步骤:
[0023]⑴
获取增量数据并更新数据集;
[0024]⑵
对更新后的数据集进行数据预处理;
[0025]⑶
基于更新后的数据集对模型运用深度学习和机器学习算法进行重训练,自动筛选训练结果最优的算法生成优化智能预测模型

[0026]进一步,所述步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于人工智能的政府会计经济分类智能预测填报方法,其特征在于,包括以下步骤:步骤
1、
从财务数据库中获取初始数据并创建数据集,对数据集中的数据进行数据预处理;所述数据包括凭证分录中的发票内容

项目经费信息及经济分类;步骤
2、
创建训练模型,选定待训练的数据集和所述数据集中待预测的目标数据列,运用深度学习算法和机器学习算法进行模型训练,完成训练后,使用验证集数据对训练好的模型进行验证并评估模型的性能,自动筛选训练结果最优的算法模型,生成最终的初始智能预测模型;步骤
3、
基于初始智能预测模型,在填报报销单时根据上传的发票内容和选择的项目经费信息,自动预测并填写对应的经济分类,由财务审核通过后,将准确的发票信息

项目经费信息和经济分类信息存入财务数据库中,作为模型优化训练的增量数据进行使用;步骤
4、
创建任务调度服务并定时获取最新的财务已制单凭证数据并增量更新数据集,根据更新后的数据集进行初始智能预测模型的自动实时训练,并不断迭代生成更新后的优化智能预测模型;步骤
5、
再次报销时,基于优化智能预测模型进行经济分类的预测,并形成新的财务已制单凭证数据,当满足任务调度服务的触发条件后,转至步骤4,启动优化智能预测模型的自训练过程;步骤
6、
任务调度情况分析,统计已启动自训练过程的智能预测模型的模型训练结果,并分析模型训练结果的稳定性
。2.
根据权利要求1所述的基于人工智能的政府会计经济分类智能预测填报方法,特征在于:所述步骤1采用从接口服务导入方式或通过本地文件导入方式从账务数据库中获取初始数据
。3.
根据权利要求1所述的基于人工智能的政府会计经济分类智能预测填报方法,特征在于:所述步骤1采用数据筛选

数据归并

数据补全

数据增强

数据转换和特征提取方法进行数据预处理;所述数据筛选是对原始数据进行筛选,过滤发票内容和经济分类为空值的无效数据;所述数据归并是对原始数据进行重复项合并,消除冗余,使样本特征更加明显;所述数据补全是对缺失的项目经费信息进行填充,通过数据增强对原始数据中单个经济分类数据较少的样本进行扩充,以增加训练样本的数据量;所述数据转换是将原始数据转换为适用于机器学习和深度学习模型的格式;所述特征提取是对发票内容进行词语...

【专利技术属性】
技术研发人员:段宏勇孙昱南杨陈宝庆李广昇李磊秦德宇巴世栋郑健鲁文秀
申请(专利权)人:天津神州浩天教育科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1