一种粮食仓储数据的异常排查方法及系统技术方案

技术编号:33374320 阅读:14 留言:0更新日期:2022-05-11 22:41
本发明专利技术公开了一种粮食仓储数据的异常排查方法及系统,基于调用接口获取每个粮库对应的粮食业务特征数据;根据所述粮食业务特征数据确定每个粮库对应的每个预设字符为首字符的实际占比;根据每个预设字符为首字符的实际占比和基于本福特定律确定的每个预设字符为首字符的频率进行相关性验证,确定每个粮库对应的相关性系数;根据所述相关性系数确定每个粮库的风险状态,以根据所述风险状态对粮库进行异常排查。本发明专利技术的方法能够减少对人工经验的依赖,仅仅通过业务系统沉淀的数据,加以特殊算法,就可以有效排查潜在数据造假行为,有助于监管机构将有限的资源投放到其他方便,提高储备粮管理工作的整体水平。高储备粮管理工作的整体水平。高储备粮管理工作的整体水平。

【技术实现步骤摘要】
一种粮食仓储数据的异常排查方法及系统


[0001]本专利技术涉及异常处理
,并且更具体地,涉及一种粮食仓储数据的异常排查方法及系统。

技术介绍

[0002][0003]目前,粮食信息化工作已经具备一定基础,每一笔粮食从收购入仓,质检、过磅、结算均在系统留痕,每一仓粮食在库保管期间的三温三湿记录都应连续采集,每次通风气调等作业都应在系统记录,信息化系统功能已经覆盖了粮库仓储作业的全部环节。经过一段时间的运行,各省已经基本完成了数据接口对接工作,开始了常态化的数据上传。然而,各省上传的数据质量却并不理想,存在数据错报,数据错位,数据缺失情况。根据数据表象,去研究粮食库实际发生了什么,能够总结以下4种情况,第一,存在人员录入错误的情况;第二,存在补录数据的情况;第三,存在粮库数据标准;第四,存在录入虚假数据的情况。要改善前三条情况,需要管理上严格要求,加强人员培训,加强工作职责梳理。第四种情况的原因与意图就更值得探究,或者只是为了填补数据,应付上级检查,或者是虚构数据制造虚假业务行为。
[0004]因此,需要一种粮食仓储数据的异常排查方法,以在已经具备数据基础的情况下,使用一些数据挖掘方法、工具快速定位异常的数据点,找到发生异常数据的企业,以为监管工作提供有效支撑。

技术实现思路

[0005]本专利技术提出一种粮食仓储数据的异常排查方法及系统,以解决如何确定异常粮库的问题。
[0006]为了解决上述问题,根据本专利技术的一个方面,提供了一种粮食仓储数据的异常排查方法,所述方法包括:r/>[0007]确定与粮食仓储数据对应的目标接口,通过调用所述目标接口获取每个粮库对应的粮食业务特征数据;
[0008]根据所述粮食业务特征数据确定每个粮库对应的每个预设字符为首字符的实际占比;
[0009]根据每个预设字符为首字符的实际占比和基于本福特定律确定的每个预设字符为首字符的频率进行相关性验证,确定每个粮库对应的相关性系数;
[0010]根据所述相关性系数确定每个粮库的风险状态,以根据所述风险状态对粮库进行异常排查。
[0011]优选地,其中所述方法基于每个所述目标接口,采用数据库抽取方式、 WebServi ce调用方式和/或接口控件方式获取粮食业务特征数据。
[0012]优选地,其中所述粮食业务特征数据,包括:每日文件名称数量、每日入库业务单
号数量、每日入库业务单号数量、每日入库结算单号数量、每日出库业务单号数量、每日出库结算单号数量、每日出库结算单号数量、每日损益单号数量、每日损益单号数量、每日温湿度检测单号数量、每日害虫检测单号数量、每日气体浓度检测单号数量、每日通风作业单号数量、每日熏蒸作业单号数量和/或每日质检报告单号数量。
[0013]优选地,其中所述方法利用如下方式根据每个预设字符为首字符的实际占比和基于本福特定律确定的每个预设字符为首字符的频率进行相关性验证,确定每个粮库对应的相关性系数,包括:
[0014][0015]F
i
=log
b
(n+1)

log
b
(n),
[0016]其中,correl(F
n
,P
n
)为相关性系数;n为预设字符的总数,任一个预设字符i的取值范围为[1,9];F
i
为基于本福特定律确定的预设字符i为首字符的频率;P
i
为预设字符i为首字符对应的实际占比;为基于本福特定律确定的所有预设字符i为首字符的频率的平均值;为所有预设字符i 为首字符对应的实际占比的平均值;b为粮食业务特征数据对应的进位制数。
[0017]优选地,其中所述根据所述相关性系数确定每个粮库的风险状态,包括:
[0018]基于相关性系数对粮库进行排序,确定粮库序列,并根据所述粮库序列和预设风险状态对应的选取范围,确定每个粮库对应的风险状态;或
[0019]将每个粮库对应的相关性系数和不同预设风险状态对应的相关性系数取值范围进行比对,并根据比对结果确定每个粮库的风险状态;
[0020]其中,所述预设风险状态包括:高风险状态、中风险状态、低风险状态和无风险状态。
[0021]根据本专利技术的另一个方面,提供了一种粮食仓储数据的异常排查系统,所述系统包括:
[0022]粮食业务特征数据获取单元,用于确定与粮食仓储数据对应的目标接口,通过调用所述目标接口获取每个粮库对应的粮食业务特征数据;
[0023]占比确定单元,用于根据所述粮食业务特征数据确定每个粮库对应的每个预设字符为首字符的实际占比;
[0024]相关性系数确定单元,用于根据每个预设字符为首字符的实际占比和基于本福特定律确定的每个预设字符为首字符的频率进行相关性验证,确定每个粮库对应的相关性系数;
[0025]风险状态确定单元,用于根据所述相关性系数确定每个粮库的风险状态,以根据所述风险状态对粮库进行异常排查。
[0026]优选地,其中所述粮食业务特征数据获取单元,基于每个所述目标接口,采用数据库抽取方式、WebService调用方式和/或接口控件方式获取粮食业务特征数据。
[0027]优选地,其中所述粮食业务特征数据,包括:每日文件名称数量、每日入库业务单号数量、每日入库业务单号数量、每日入库结算单号数量、每日出库业务单号数量、每日出库结算单号数量、每日出库结算单号数量、每日损益单号数量、每日损益单号数量、每日温湿度检测单号数量、每日害虫检测单号数量、每日气体浓度检测单号数量、每日通风作业单号数量、每日熏蒸作业单号数量和/或每日质检报告单号数量。
[0028]优选地,其中所述相关性系数确定单元,利用如下方式根据每个预设字符为首字符的实际占比和基于本福特定律确定的每个预设字符为首字符的频率进行相关性验证,确定每个粮库对应的相关性系数,包括:
[0029][0030]F
i
=log
b
(n+1)

log
b
(n),
[0031]其中,correl(F
n
,P
n
)为相关性系数;n为预设字符的总数,任一个预设字符i的取值范围为[1,9];F
i
为基于本福特定律确定的预设字符i为首字符的频率;P
i
为预设字符i为首字符对应的实际占比;为基于本福特定律确定的所有预设字符i为首字符的频率的平均值;为所有预设字符i 为首字符对应的实际占比的平均值;b为粮食业务特征数据对应的进位制数。
[0032]优选地,其中所述风险状态确定单元,根据所述相关性系数确定每个粮库的风险状态,包括:
[0033]基于相关性系数对粮库进行排序,确定粮库序列,并根据所述粮库序列和预设风险状态对应的选取范围,确定每个粮库对应的风险状态;或
[0034]将每个粮库对应的相关性系数和不同预设风险状态对应的相关性系数取值范围进行比本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种粮食仓储数据的异常排查方法,其特征在于,所述方法包括:确定与粮食仓储数据对应的目标接口,通过调用所述目标接口获取每个粮库对应的粮食业务特征数据;根据所述粮食业务特征数据确定每个粮库对应的每个预设字符为首字符的实际占比;根据每个预设字符为首字符的实际占比和基于本福特定律确定的每个预设字符为首字符的频率进行相关性验证,确定每个粮库对应的相关性系数;根据所述相关性系数确定每个粮库的风险状态,以根据所述风险状态对粮库进行异常排查。2.根据权利要求1所述的方法,其特征在于,所述方法基于每个所述目标接口,采用数据库抽取方式、WebService调用方式和/或接口控件方式获取粮食业务特征数据。3.根据权利要求1所述的方法,其特征在于,所述粮食业务特征数据,包括:每日文件名称数量、每日入库业务单号数量、每日入库业务单号数量、每日入库结算单号数量、每日出库业务单号数量、每日出库结算单号数量、每日出库结算单号数量、每日损益单号数量、每日损益单号数量、每日温湿度检测单号数量、每日害虫检测单号数量、每日气体浓度检测单号数量、每日通风作业单号数量、每日熏蒸作业单号数量和/或每日质检报告单号数量。4.根据权利要求1所述的方法,其特征在于,所述方法利用如下方式根据每个预设字符为首字符的实际占比和基于本福特定律确定的每个预设字符为首字符的频率进行相关性验证,确定每个粮库对应的相关性系数,包括:F
i
=log
b
(n+1)

log
b
(n),其中,correl(F
n
,P
n
)为相关性系数;n为预设字符的总数,任一个预设字符i的取值范围为[1,9];F
i
为基于本福特定律确定的预设字符i为首字符的频率;P
i
为预设字符i为首字符对应的实际占比;为基于本福特定律确定的所有预设字符i为首字符的频率的平均值;为所有预设字符i为首字符对应的实际占比的平均值;b为粮食业务特征数据对应的进位制数。5.根据权利要求1所述的方法,其特征在于,所述根据所述相关性系数确定每个粮库的风险状态,包括:基于相关性系数对粮库进行排序,确定粮库序列,并根据所述粮库序列和预设风险状态对应的选取范围,确定每个粮库对应的风险状态;或将每个粮库对应的相关性系数和不同预设风险状态对应的相关性系数取值范围进行比对,并根据比对结果确定每个粮库的风险状态;其中,所述预设风险状态包括:高风险状态、中风险状态、低风险状态和无风险状态。6.一种粮食仓储数据的异常排查系统,其特征在于,所述系统包括:粮食业务特征数据获取单元,用...

【专利技术属性】
技术研发人员:彭远赵骐张虎成孔砚陈晋
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1