一种识别非法单据的方法以及识别装置制造方法及图纸

技术编号:20329218 阅读:35 留言:0更新日期:2019-02-13 05:47
本申请实施例公开了一种识别非法单据的方法,包括:根据历史单据数据确定目标字段对应的异常值;获取目标单据,目标单据包括目标字段;判断目标字段在目标单据中对应的值与异常值是否匹配;若匹配,则提示目标单据为非法单据。本申请实施例还提供相应的识别装置。本申请技术方案能够在核对大量单据的过程中,有效地识别出非法单据,解决了依靠信用分数这一角度来核对大量单据所带来的问题,提高了核对效率以及准确度。

【技术实现步骤摘要】
一种识别非法单据的方法以及识别装置
本申请涉及识别
,具体涉及一种识别非法单据的方法以及识别装置。
技术介绍
众所周知,单据是在经济业务发生时所取得或填制的、载明交易、事项实际情况的书面证明,比如领料单、入库单等。在企业的财务管理过程中,它是进行会计核算的原始资料和重要依据,所以每家企业的财务人员会花费大量的精力在单据的核对上,比如核对单据上的人员、金额、原因等内容。在企业普遍使用财务管理软件的今天,通过软件核对单据的准确度及规范性决定着企业财务管理的效率。在现有的技术中,核对单据通常采用信用这种核对方式,它主要是以信用分数为依据。绝大多数的时候,已经将信用分数低的人的提单作为了潜在非法单据进行重点关注,而对于信用分数高的人的提单就不会过多的关注。因此,当需要核对大量的单据时,采用信用只能从信用分数进行观察,角度较单一,难以在核对过程中发现非法单据。
技术实现思路
本申请实施例提供了一种识别非法单据的方法以及识别装置,能够在核对大量单据的过程中,有效地识别出非法单据。有鉴于此,本申请实施例提供如下方案:本申请第一方面提供一种识别非法单据的方法,可应用到财务领域中,该识别非法单据的方法可以包括:根据历史单据数据确定目标字段对应的异常值;获取目标单据,目标单据包括目标字段;判断目标字段在目标单据中对应的值与异常值是否匹配;若匹配,则提示目标单据为非法单据。该历史单据数据可以是已经存储在数据库中,目标字段可以包括多种类型的字段,比如:数值类型、文字类型等。由以上第一方面可见,可以通过目标单据中的目标字段对应的值与根据历史单据数据确定出的异常值进行匹配,如若匹配上,就可以认为该目标单据存在较高的非法潜在风险,这样就可以提示该单据为非法单据;解决了在核对大量的单据过程中,仅依靠信用分数这单一角度来识别非法单据所带来的问题,有效地识别出非法单据。可选地,结合上述第一方面,在第一种可能的实现方式中,根据历史单据数据确定目标字段对应的异常值,可以包括:划分历史单据数据中目标字段对应的值为N个数据组,N为正整数;计算每个数据组对应的异常占比以及N个数据组对应的平均占比,异常占比通过异常单据数量和单据总数计算得到,单据总数为目标字段的值属于数据组的所有单据的数量,异常单据数量为所有单据中非法单据的数量;将异常占比与平均占比的差值大于预设阈值的数据组确定为目标数据组,并将目标数据组中的值确定为目标字段的异常值。由于不同的字段属于不同的类型,所以可以将历史单据数据中的目标字段划分为不同的类型,再分别进行计算各个类型中的各个字段的异常占比和平均占比,可以适用于多个不同场景下确定异常值,为确定出异常值提供了多样性的方式。可选地,结合上述第一方面第一种可能实现的方式,在第二种可能的实现方式中,目标字段包括名称字段,划分历史单据数据中目标字段对应的值为N个数据组,可以包括:划分名称字段对应的每一个名称为一个数据组,名称的数量和为N;对应地,在将目标数据组中的值确定为目标字段的异常值之后,判断目标字段在目标单据中对应的值与异常值是否匹配,包括:获取名称字段在目标单据中对应的名称;判断获取的名称是否与名称字段的异常值相同;若是,则提示目标单据为非法单据。由于目标单据可以包括多种类型的目标字段,但是不同的目标字段的需要采取不同的统计方式,所以当目标字段为名称字段时,就可以根据名称字段对应的统计方式确定出异常值;再通过把目标单据中的名称字段对应的名称与该异常值匹配,有效地提高了识别的准确度。可选地,结合上述的第一方面第一种可能实现的方式,在第三种可能的实现方式中,目标字段包括数值字段,划分历史单据数据中目标字段对应的值为N个数据组,可以包括:排列数值字段对应的数值;划分排列后的数值为N个等距的区间,每一划分后的数值一一对应于区间中;确定N个等距的区间为N个数据组;对应地,在将目标数据组中的值确定为目标字段的异常值之后,判断目标字段在目标单据中对应的值与异常值是否匹配,可以包括:获取数值字段在目标单据中对应的数值;判断获取的数值是否落入目标数据组内;若是,则提示目标单据为非法单据。由于数值字段对应的数值可以划分成区间,因此可以根据数值字段对应的统计方式确定出有异常的区间,再判断目标单据中数值字段对应的数值是否落在了异常的区间内,有效地提高了识别的准确度。可选地,结合上述的第一方面第一种可能实现的方式,在第四种可能的实现方式中,目标字段包括相似字段,划分历史单据数据中目标字段对应的值为N个数据组,可以包括:确定相似字段中词意相近的词语为同类词,同类词是结合语句解析软件与词库得到的;统计类范围的个数和,类范围的个数和为N,类范围是把每一类同类词确定为一个类范围;确定N个类范围为N个数据组;对应地,在将目标数据组中的值确定为目标字段的异常值之后,判断目标字段在目标单据中对应的值与异常值是否匹配,可以包括:获取相似字段在目标单据中对应的词语;判断获取的词语是否落入目标数据组内;若是,则提示目标单据为非法单据。由于相似字段对应的词意相似的词语可以划分为同类词,因此可以根据相似字段对应的统计方式确定出有异常的类范围,再判断目标单据中相似字段对应的词语是否落在了异常的类范围内,有效地提高了识别的准确度以及效率。可选地,结合上述的第一方面,在第五种可能的实现方式中,在根据历史单据数据确定目标字段对应的异常值之前,还可以包括:获取范围表,范围表包括第一表、第二表以及第三表;设置第一关联关系和第二关联关系,第一关联关系是第一表中的外键与第二表中的主键之间的关联关系,第二关联关系是第二表中的外键与第三表中的主键之间的关联关系,第一表中的外键为第二表中的主键,第二表中的外键为第三表中的主键,第一关联关系和第二关联关系是用于获取历史单据数据。由于表之间通过外键和主键之间的关联,可以获取到外键所在表中的数据,保持数据的一致性和完整性。本申请第二方面提供一种识别装置,该装置具有实现上述第一方面或第一方面任意一种可能实现方式的方法的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的单元、模块或子模块。本申请第三方面提供的计算机设备,包括:处理器和存储器;该存储器用于存储程序指令,当该装置时,该处理器执行该存储器存储的该程序指令,以使该装置执行如上述第一方面或第一方面任意一种可能实现方式的识别非法单据的方法。本申请第四方面提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机可以执行上述第一方面或第一方面任意一种可能实现方式的识别非法单据的方法。本申请第五方面提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机可以执行上述第一方面或第一方面任意一种可能实现方式的识别非法单据的方法。本申请第六方面提供一种芯片系统,该芯片系统包括处理器,用于支持装置实现上述第一方面或第一方面任意一种可能的实现方式中所涉及的功能。在一种可能的设计中,芯片系统还包括存储器,存储器,用于保存装置必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。其中,第二方面、第三方面、第四方面、第五方面、第六方面中任一种实现方式所带来的技术效果可参见第一方面中不本文档来自技高网...

【技术保护点】
1.一种识别非法单据的方法,其特征在于,包括:根据历史单据数据确定目标字段对应的异常值;获取目标单据,所述目标单据包括所述目标字段;判断所述目标字段在所述目标单据中对应的值与所述异常值是否匹配;若匹配,则提示所述目标单据为非法单据。

【技术特征摘要】
1.一种识别非法单据的方法,其特征在于,包括:根据历史单据数据确定目标字段对应的异常值;获取目标单据,所述目标单据包括所述目标字段;判断所述目标字段在所述目标单据中对应的值与所述异常值是否匹配;若匹配,则提示所述目标单据为非法单据。2.根据权利要求1所述的方法,其特征在于,根据历史单据数据确定目标字段对应的异常值,包括:划分历史单据数据中所述目标字段对应的值为N个数据组,所述N为正整数;计算每个数据组对应的异常占比以及所述N个数据组对应的平均占比,所述异常占比通过异常单据数量和单据总数计算得到,所述单据总数为目标字段的值属于所述数据组的所有单据的数量,所述异常单据数量为所述所有单据中非法单据的数量;将所述异常占比与所述平均占比的差值大于预设阈值的数据组确定为目标数据组,并将所述目标数据组中的值确定为所述目标字段的异常值。3.根据权利要求2所述的方法,其特征在于,所述目标字段包括名称字段,划分历史单据数据中所述目标字段对应的值为N个数据组,包括:划分所述名称字段对应的每一个名称为一个数据组,所述名称的数量和为N;对应地,在将所述目标数据组中的值确定为所述目标字段的异常值之后,判断所述目标字段在所述目标单据中对应的值与所述异常值是否匹配,包括:获取所述名称字段在所述目标单据中对应的名称;判断所述获取的所述名称是否与所述名称字段的异常值相同;若是,则提示所述目标单据为非法单据。4.根据权利要求2所述的方法,其特征在于,所述目标字段包括数值字段,划分历史单据数据中所述目标字段对应的值为N个数据组,包括:排列所述数值字段对应的数值;划分排列后的数值为N个等距的区间,每一所述划分后的数值一一对应于所述区间中;确定所述N个等距的区间为所述N个数据组;对应地,在将所述目标数据组中的值确定为所述目标字段的异常值之后,判断所述目标字段在所述目标单据中对应的值与所述异常值是否匹配,包括:获取所述数值字段在所述目标单据中对应的数值;判断所述获取的所述数值是否落入所述目标数据组内;若是,则提示所述目标单据为非法单据。5.根据权利要求2所述的方法,其特征在于,所述目标字段包括相似字段,划分历史单据数据中所述目标字段对应的值为N个数据组,包括:确定所述相似字段中词意相近的词语为同类词,所述同类词是结合语句解析软件与词库得到的;统计类范围的个数和,所述类范围的个数和为N,所述类范围是把每一类同类词确定为一个类范围;确定所述N个类范围...

【专利技术属性】
技术研发人员:张国锐
申请(专利权)人:金蝶软件中国有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1