提升审计精度的方法及系统技术方案

技术编号:27105892 阅读:22 留言:0更新日期:2021-01-25 18:55
本发明专利技术涉及数据审计领域,具体涉及一种提升审计精度的方法及系统,解决了设计数据中出现的偏差,极大地提高了审计精度。提升审计精度的方法,包括:对数据进行预处理,确定审计数据;对审计数据运用格拉布斯检验法剔除异常值,进行数据清洗;根据清洗之后的数据建立正态分布模型并进行仿真;在仿真过程中,引入偏度以及峰度模型修正正态分布模型提升审计精度。本发明专利技术适用于提升审计精度。本发明专利技术适用于提升审计精度。本发明专利技术适用于提升审计精度。

【技术实现步骤摘要】
提升审计精度的方法及系统


[0001]本专利技术涉及数据审计领域,具体涉及一种提升审计精度的方法及系统。

技术介绍

[0002]在审计领域数据的录入的过程中,由于各种因素导致录数据可能出现异常,一般数据都是由业务人员凭借人工进行统计,简单分析,没有系统的数据分析方法。审计领域中现有的数据分析方法是依靠审计人员的经验进行人工检测,效率比较低下。而在其他有类似需求的领域,则是基于统计法的检验方法,但是由于审计领域的数据量非常大,首先需要根据需求对大量的数据进行分组,然后再对每组数据进行分析,而其他领域的分析方法并未考虑到审计领域的数据特征,所以难以应用在审计领域中。因此,引入机器学习针对审计系统进行数据分析,可以合理高效的利用审计系统数据,提炼有价值数据,增强审计系统时效性成为时代的主流。
[0003]在机器学习的众多算法中,统计分析是最基本的算法,包含许多重要的模型,为其他机器学习算法提供训练样本等,其中概率分布模型是统计分析中最重要的组成部分,正态分布又名高斯分布,是一个在数学、物理及工程等领域都非常重要的概率分布,若随机变量服从一个位置参数、尺度参数为的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于尺度参数,决定了分布的幅度。正态分布的概率密度函数曲线呈钟形,因此又经常称之为钟形曲线。
[0004]审计系统采购信息记录物料价格是连续型变量,故排除离散型分布;经过基本的统计分析以及对业务场景的了解,判定同一物料的大部分采购信息价格处在均值附近,存在少量异常值,故排除均匀分布和指数分布。
[0005]正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
[0006]现有数据审计,仅仅依赖正态分布模型,只经过正态分布模型处理的数据,往往存在偏差,因此导致审计精度不高,图3为现有审计精度指标图,从图中看出其审计精度存在大量离散点。

技术实现思路

[0007]本专利技术的目的是提供一种提升审计精度的方法及系统,解决了设计数据中出现的偏差,极大地提高了审计精度。
[0008]本专利技术采取如下技术方案实现上述目的,提升审计精度的方法,包括:
[0009]步骤(1)、对数据进行预处理,确定审计数据;
[0010]步骤(2)、对审计数据运用格拉布斯检验法剔除异常值,进行数据清洗;
[0011]步骤(3)、根据清洗之后的数据建立正态分布模型并进行仿真;
[0012]步骤(4)、在仿真过程中,引入偏度以及峰度模型修正正态分布模型提升审计精度。
[0013]进一步的是,在步骤(2)中,异常值包括:人工录入的异常数据以及审计系统存在的异常数据。
[0014]进一步的是,在步骤(2)中,运用格拉布斯检验法剔除异常值的具体方法包括:
[0015]21、对原始审计数据进行异常值剔除以及异常离散值剔除;
[0016]22、剔除异常值及异常离散值后,确定审计数据中的最大值和最小值;
[0017]23、将最大值及最小值与审计数据均值差值最大的的值作为可疑值;
[0018]24、运用格拉布斯模型剔除可疑值,并进行二次格拉布斯模型异常值剔除。
[0019]进一步的是,在步骤(4)中,引入偏度模型修正正态分布模型的具体方法包括:
[0020]41A、获取正态分布模型处理后的审计数据;
[0021]42A、根据正态分布模型处理后的审计数据建立偏度模型;
[0022]43A、根据偏度模型分析审计数据偏度,若偏度大于零,则设定偏度值对正态分布模型进行修正;若偏度小于零,则采取剔除异常值之后进行二次正态分布模型运算;
[0023]44A、对正态分布模型进行偏度修正或二次正态分布模型运算后,根据仿真结果调整偏度系数,得到最优解。
[0024]进一步的是,在步骤44A中,得到最优审计数据的具体方法包括:根据仿真结果调整偏度系数,再次对正态分布模型进行偏度修正,然后通过修正后的正态分布模型对审计数据进行处理,得到最优审计数据。
[0025]进一步的是,在步骤(4)中,引入峰度模型修正正态分布模型的具体方法包括:
[0026]41B、获取正态分布模型处理后的审计数据;
[0027]42B、根据正态分布模型处理后的审计数据建立峰度模型;
[0028]43B、根据峰度模型分析审计数据峰度,根据审计数据峰度设定峰度值修正正态分布模型;
[0029]44B、对正态分布模型进行峰度修正后,根据仿真结果调整峰度系数,得到最优解。
[0030]进一步的是,在步骤44B中,得到最优审计数据的具体方法包括:根据仿真结果调整峰度系数,再次对正态分布模型进行偏度修正,然后通过修正后的正态分布模型对审计数据进行处理,得到最优审计数据。
[0031]提升审计精度的系统,包括:
[0032]数据预处理模块,用于对数据进行预处理,确定审计数据;
[0033]数据清洗模块,用于对审计数据运用格拉布斯检验法剔除异常值,进行数据清洗;
[0034]仿真模块,用于根据清洗之后的数据建立正态分布模型并进行仿真;
[0035]修正模块,用于在仿真过程中,引入偏度以及峰度模型修正正态分布模型提升审计精度。
[0036]本专利技术对审计数据运用格拉布斯检验法剔除异常值,进行数据清洗,减少了数据的误差,然后再根据清洗后的数据建立正态分布模型并进行仿真,并在仿真过程中通过引入偏度以及峰度模型对已建立的正态分布模型进行修正,降低了数据出现的偏差,极大地提高了审计的精度。
附图说明
[0037]图1是本专利技术提升审计精度的方法的方法流程图。
[0038]图2是本专利技术提升审计精度的系统的结构框图。
[0039]图3是现有未优化的审计系统精度指标图。
[0040]图4是本专利技术对异常数据剔除优化后审计精度图。
[0041]图5是本专利技术经过偏度模型修正后审计精度图。
[0042]图6是本专利技术经过峰度模型修正后审计精度图。
具体实施方式
[0043]本专利技术提升审计精度的方法,其方法流程图如图1,包括:
[0044]步骤101、对数据进行预处理,确定审计数据;
[0045]步骤102、对审计数据运用格拉布斯检验法剔除异常值,进行数据清洗;
[0046]步骤103、根据清洗之后的数据建立正态分布模型并进行仿真;
[0047]步骤104、在仿真过程中,引入偏度以及峰度模型修正正态分布模型提升审计精度。
[0048]步骤102中,异常值包括:人工录入的异常数据以及审计系统存在的异常数据。
[0049]步骤102中,运用格拉布斯检验法剔除本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.提升审计精度的方法,其特征在于,包括:步骤(1)、对数据进行预处理,确定审计数据;步骤(2)、对审计数据运用格拉布斯检验法剔除异常值,进行数据清洗;步骤(3)、根据清洗之后的数据建立正态分布模型并进行仿真;步骤(4)、在仿真过程中,引入偏度以及峰度模型修正正态分布模型提升审计精度。2.根据权利要求1所述的提升审计精度的方法,其特征在于,在步骤(2)中,异常值包括:人工录入的异常数据以及审计系统存在的异常数据。3.根据权利要求1所述的提升审计精度的方法,其特征在于,在步骤(2)中,运用格拉布斯检验法剔除异常值的具体方法包括:21、对原始审计数据进行异常值剔除以及异常离散值剔除;22、剔除异常值及异常离散值后,确定审计数据中的最大值和最小值;23、将最大值及最小值与审计数据均值差值最大的的值作为可疑值;24、运用格拉布斯模型剔除可疑值,并进行二次格拉布斯模型异常值剔除。4.根据权利要求1所述的提升审计精度的方法,其特征在于,在步骤(4)中,引入偏度模型修正正态分布模型的具体方法包括:41A、获取正态分布模型处理后的审计数据;42A、根据正态分布模型处理后的审计数据建立偏度模型;43A、根据偏度模型分析审计数据偏度,若偏度大于零,则设定偏度值对正态分布模型进行修正;若偏度小于零,则采取剔除异常值之后进行二次正态分布模型运算;44A、对正态分布模型进行偏度修正或二次正态分布模型运算后,根据...

【专利技术属性】
技术研发人员:王洪贺孙永强
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1