一种基于大数据的财务数据清洗管理系统及方法技术方案

技术编号:42058694 阅读:59 留言:0更新日期:2024-07-16 23:37
本发明专利技术涉及数据清洗技术领域,尤其涉及一种基于大数据的财务数据清洗管理系统及方法,本发明专利技术提出以下方案,首先采集财务数据,通过词性分析对财务数据进行整理,获取统一格式财务数据,其次根据重复数据检测策略对财务数据集进行处理,输出重复值清洗后的财务数据集,根据重复值清洗后的财务数据集,通过聚类算法将财务数据集中缺失数据进行标记,并根据拉格朗日插值法对标记的缺失数据进行填充,最后通过财务数据清洗监控模型,对财务数据清洗过程进行监管,通过大数据技术构建自适应学习算法,对财务数据清洗监控模型进行更新,有助于及时做出业务决策。

【技术实现步骤摘要】

本专利技术涉及数据清洗,尤其涉及一种基于大数据的财务数据清洗管理系统及方法


技术介绍

1、随着技术的进步,社会从信息时代向数据时代发展,数据在生活、研究中的重要性越来越强。数据挖掘技术是以数据为研究对象的革新技术,对各行各业都带来了机遇与挑战。在这样的大背景下,通过数据挖掘技术解决现有财务分析体系中的问题,从财务数据中发掘有价值的财务信息并将其反馈给企业决策者,是一种行之有效的方法。但由于财务数据涉及的领域较多,来源复杂,在规范性和完整性等多方面存在着更复杂的质量问题,导致常用的清洗算法对于财务数据进行清洗的结果不理想,影响了财务数据的使用效果和利用率。

2、例如公开号为cn117076444a的中国专利提供一种财务数据处理方法、系统、可读存储介质及计算机,该方法包括:将获取到的待处理财务数据分别按照时间周期和数据类型进行数据分类得到分类结果;通过分类结果所获取的数据模板编号从模板数据库中调用数据模板;解析出待处理财务数据的多个数据标识,并在各数据标识中添加分类标识符,以得到分类标识;基于分类标识和预设的数据处理模型对待处理财务数据进行数据清本文档来自技高网...

【技术保护点】

1.一种基于大数据的财务数据清洗管理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于大数据的财务数据清洗管理方法,其特征在于,所述财务数据包括结构化财务数据和非结构化财务数据,所述结构化财务数据包括资产负债表、综合损益表、利润表、税务信息和经营业务数据表,所述非结构化财务数据包括企业经营分析报告、企业完整年报和各类销售订单。

3.根据权利要求2所述一种基于大数据的财务数据清洗管理方法,其特征在于,所述重复数据检测策略具体步骤如下:

4.根据权利要求3所述一种基于大数据的财务数据清洗管理方法,其特征在于,所述滑动窗口包括初始滑动窗口和动态...

【技术特征摘要】

1.一种基于大数据的财务数据清洗管理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于大数据的财务数据清洗管理方法,其特征在于,所述财务数据包括结构化财务数据和非结构化财务数据,所述结构化财务数据包括资产负债表、综合损益表、利润表、税务信息和经营业务数据表,所述非结构化财务数据包括企业经营分析报告、企业完整年报和各类销售订单。

3.根据权利要求2所述一种基于大数据的财务数据清洗管理方法,其特征在于,所述重复数据检测策略具体步骤如下:

4.根据权利要求3所述一种基于大数据的财务数据清洗管理方法,其特征在于,所述滑动窗口包括初始滑动窗口和动态滑动窗口,所述初始滑动窗口为滑动窗口设定最小值,所述动态滑动窗口的计算公式为:

【专利技术属性】
技术研发人员:赵亮
申请(专利权)人:青岛云创智通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1