财务数据异常检测方法、计算机可读介质及电子设备技术

技术编号:39064743 阅读:10 留言:0更新日期:2023-10-12 19:57
本发明专利技术实施例公开了财务数据异常检测方法、计算机可读介质及电子设备;方法包括步骤:S1、对财务原始凭证明细数据进行原子对匹配,得到系列凭证原子对;其中,每一个财务原始凭证只对应一个凭证原子对;凭证原子对只包含分别来自借、贷两个方向的两条记录信息;S2、基于得到的系列凭证原子对进行特征构建得到系列多维度特征数据,其中,每一个凭证原子对对应一个多维度特征数据;S3、基于构建的系列多维度特征数据,利用无监督异常检测算法进行神经网络模型训练,得到训练后的神经网络模型;S4、利用训练好的神经网络模型对新的财务数据进行异常检测。基于异常检测结果,再由专业审计人员进一步进行筛查,能够大大减少工作量,提高审计效率。高审计效率。高审计效率。

【技术实现步骤摘要】
财务数据异常检测方法、计算机可读介质及电子设备


[0001]本专利技术属于数据检测
,具体涉及财务数据异常检测方法、计算机可读介质及电子设备。

技术介绍

[0002]数据的异常检测涉及的领域较为广泛,而且在不同领域中数据异常的类型不同,对异常数据的定义也无法统一。在财务数据异常检测这一领域,没有对异常数据的定义。
[0003]财务的原始记账凭证明细数据的基本特点是,一张完整的财务凭证存在多条行项目记录。目前针对此类数据的研究思路比较少,没有成熟、完善的处理方法。

技术实现思路

[0004]有鉴于此,一方面,一些实施例公开了财务数据异常检测方法的技术方案,检测方法包括步骤:
[0005]S1、对财务原始凭证明细数据进行原子对匹配,得到系列凭证原子对;其中,每一个财务原始凭证只对应一个凭证原子对;凭证原子对只包含分别来自借、贷两个方向的两条记录信息;
[0006]S2、基于得到的系列凭证原子对进行特征构建,得到系列多维度特征数据,其中,每一个凭证原子对对应一个多维度特征数据;
[0007]S3、基于构建的系列多维度特征数据,利用无监督异常检测算法进行神经网络模型训练,得到训练后的神经网络模型;
[0008]S4、利用训练好的神经网络模型,对新的财务数据进行异常检测。
[0009]进一步,一些实施例公开的财务数据异常检测方法,步骤S1中,对财务原始数据凭证明细数据进行原子对匹配包括:
[0010]S11、若财务原始凭证中只有一条借方记录和一条贷方记录,则该财务数据直接作为凭证原子对;
[0011]S12、若财务原始凭证中有一条借方记录和多条贷方记录,则,对多条贷方记录根据金额绝对值进行排序,将金额绝对值最大的贷方记录与借方记录进行匹配,若二者的绝对值之差小于预设的阈值,则借方记录与金额绝对值最大的贷方记录组成该财务原始凭证的凭证原子对;否则,放弃该财务原始凭证的数据;
[0012]S13、若财务原始凭证中有一条贷方记录和多条借方记录,则,对多条借方记录根据金额绝对值进行排序,将金额绝对值最大的借方记录与贷方记录进行匹配,若二者的绝对值之差小于预设的阈值,则贷方记录与金额绝对值最大的借方记录组成该财务原始凭证的凭证原子对;否则,放弃该财务原始凭证的数据;
[0013]S14、若财务原始凭证中有多条借方记录和多条贷方记录,则,分别对贷方记录和借方记录根据金额绝对值进行排序,将金额绝对值最大的贷方记录与金额绝对值最大的借方记录进行匹配,若二者的绝对值之差小于预设的阈值,则金额绝对值最大的借方记录与
金额绝对值最大的贷方记录组成该财务原始凭证的原子对;否则,放弃该财务原始凭证的数据。
[0014]一些实施例公开的财务数据异常检测方法,步骤S2中,基于得到的系列凭证原子对进行特征构建包括:
[0015]S21、基于财务原始凭证的记账日期,构建与该记账日期相关的多维度特征数据;
[0016]S22、基于凭证主体单位的凭证类型、凭证科目类型,对凭证类型、凭证科目类型进行二进制编码,得到一定维度的特征数据;
[0017]S23、对特征数据进行标准化处理,得到财务原始凭证明细数据的多维度特征数据。
[0018]一些实施例公开的财务数据异常检测方法,步骤S21具体包括:
[0019]S211、基于财务原始凭证的记账日期,构建与代表该记账日期的二维特征数据;
[0020]S212、基于财务原始凭证的记账日期,构建代表该记账日期当日人民币对外币的汇率的二维特征数据;
[0021]S213、基于财务原始凭证的记账日期,构建代表该记账日期当日是否为国家休假日的一维特征数据;
[0022]最终上述步骤得到的特征数据组成与该记账日期相关的多维度特征数据。
[0023]一些实施例公开的财务数据异常检测方法,步骤S23、对特征数据进行标准化处理,包括:利用基于原始特征数据的均值和标准差对原特征数据进行标准化,得到标准化新数据,计算方法为:
[0024]标准化新数据=(原特征数据

原始特征数据均值)/原始特征数据标准差。
[0025]一些实施例公开的财务数据异常检测方法,步骤S22中对凭证类型进行二进制编码包括:
[0026]S221、确定凭证类型的数量;
[0027]S222、确定凭证类型以二进制编码表示的维度,计算公式为:
[0028][0029]其中,N1为凭证类型的数量,表示向上取整,n1为凭证类型特征数据的维度,取值正整数;
[0030]S223、以二进制数据0、1表达凭证类型的n维特征数据。
[0031]一些实施例公开的财务数据异常检测方法,步骤S22中对凭证科目类型进行二进制编码包括:
[0032]S224、确定凭证科目类型的数量;
[0033]S222、确定凭证科目类型以二进制编码表示的维度,计算公式为:
[0034][0035]其中,N2为凭证科目类型的数量,表示向上取整,n2为凭证科目类型特征数据的维度,取值正整数;
[0036]S223、以二进制数据0、1表达凭证科目类型的n维特征数据。
[0037]一些实施例公开的财务数据异常检测方法,步骤S4中,对新的财务数据进行异常检测包括:
[0038]S41、对财务原始凭证明细数据进行原子对匹配,得到凭证原子对;
[0039]S42、基于得到的凭证原子对进行特征构建,得到多维度特征数据;
[0040]S43、将得到的多维度特征数据输入训练好的神经网络模型进行异常检测,得到检测结果。
[0041]另一方面,一些实施例公开了计算机可读介质,计算机可读介质包含计算机执行指令,计算机执行指令经由数据处理设备处理时,该数据处理设备执行本文实施例公开的财务数据异常检测方法。
[0042]再一方面,一些实施例公开了电子设备,包括:
[0043]一个或多个处理器;
[0044]存储装置,其上存储有一个或多个程序;
[0045]当程序被处理器执行时,实现本文实施例公开的财务数据异常检测方法。
[0046]本专利技术实施例公开的财务数据异常检测方法,对财务原始凭据明细数据进行原子对匹配,进而对财务原始凭据明细数据进行特征构建,得到财务原始凭据明细数据的多维度特征数据,多个多维度特征数据形成系列多维度特征数据,进而利用该系列多维度特征数据进行神经网络模型训练,利用训练好的神经网络模型,可以对新的财务数据进行异常检测,基于异常检测结果,再由专业审计人员进一步进行筛查,得到更为准确的财务数据异常检测结果;因此,在财务数据审计背景下进行异常检测任务,由财务数据异常检测方法初步判别给定输入数据是否为异常数据,再由专业审计人员进行筛查,能够大大减少人工工作量,提高财务数据的审计效率。
附图说明
[0047]图1一些实施例公开的财务数据异常检测方法流程图。
具体实施方式...

【技术保护点】

【技术特征摘要】
1.财务数据异常检测方法,其特征在于,包括步骤:S1、对财务原始凭证明细数据进行原子对匹配,得到系列凭证原子对;其中,每一个财务原始凭证只对应一个凭证原子对;凭证原子对只包含分别来自借、贷两个方向的两条记录信息;S2、基于得到的系列凭证原子对进行特征构建,得到系列多维度特征数据,其中,每一个凭证原子对对应一个多维度特征数据;S3、基于构建的系列多维度特征数据,利用无监督异常检测算法进行神经网络模型训练,得到训练后的神经网络模型;S4、利用训练好的神经网络模型,对新的财务数据进行异常检测。2.根据权利要求1所述的财务数据异常检测方法,其特征在于,步骤S1中,对财务原始数据凭证明细数据进行原子对匹配包括:S11、若财务原始凭证中只有一条借方记录和一条贷方记录,则该财务数据直接作为凭证原子对;S12、若财务原始凭证中有一条借方记录和多条贷方记录,则,对多条贷方记录根据金额绝对值进行排序,将金额绝对值最大的贷方记录与借方记录进行匹配,若二者的绝对值之差小于预设的阈值,则借方记录与金额绝对值最大的贷方记录组成该财务原始凭证的凭证原子对;否则,放弃该财务原始凭证的数据;S13、若财务原始凭证中有一条贷方记录和多条借方记录,则对多条借方记录根据金额绝对值进行排序,将金额绝对值最大的借方记录与贷方记录进行匹配,若二者的绝对值之差小于预设的阈值,则贷方记录与金额绝对值最大的借方记录组成该财务原始凭证的凭证原子对;否则,放弃该财务原始凭证的数据;S14、若财务原始凭证中有多条借方记录和多条贷方记录,则,分别对贷方记录和多条借方记录根据金额绝对值进行排序,将金额绝对值最大的贷方记录与金额绝对值最大的借方记录进行匹配,若二者的绝对值之差小于预设的阈值,则金额绝对值最大的借方记录与金额绝对值最大的贷方记录组成该财务原始凭证的原子对;否则,放弃该财务原始凭证的数据。3.根据权利要求1所述的财务数据异常检测方法,其特征在于,步骤S2中,基于得到的系列凭证原子对进行特征构建包括:S21、基于财务原始凭证的记账日期,构建与所述记账日期相关的多维度特征数据;S22、基于凭证主体单位的凭证类型、凭证科目类型,对凭证类型、凭证科目类型进行二进制编码,得到一定维度的特征数据;S23、对特征数据进行标准化处理,得到财务原始凭证明细数据的多维度特征数据。4.根据权利要求3所述的财务数据异常检测方法,其特征在于,步骤...

【专利技术属性】
技术研发人员:章凯王亚杰戴悦
申请(专利权)人:中远海运科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1