【技术实现步骤摘要】
一种基于人工智能技术的数据质量管理方法
[0001]本专利技术涉及数据管理
,具体涉及一种基于人工智能技术的数据质量管理方法
。
技术介绍
[0002]随着企业自身的业务信息的逐渐增多,企业平台内部的系统会因业务信息产生大量的业务数据,例如,订单数据
、
销售数据
、
产品数据等,这些在形成时,通常是通过人员或系统录入的,但是在录入的过程中,数据难免会因人员的误操作
、
系统的故障出现一些错误,以此导致目前企业内数据库的数据质量存在问题,目前对存在质量问题的数据通常的处理方式为提取数据库内的数据,进行一一核对并矫正,但是对于海量的数据来说,并不是所有的数据均存在质量问题,于此情况下,导致目前对数据质量的分析处置产生了效率性的影响;并且,数据在录入后,需要设置录入该数据的责任人,当责任人所对应的数据出现异常时,如何能够对该责任人及数据做出相应的风险管控(避免对海量数据一一矫正的基础上进行风险管控),以降低后续数据持续异常变化的情况均是目前需要解决的问题
。
技术实现思路
[0003]针对现有技术所存在的上述缺点,本专利技术提供了一种基于人工智能技术的数据质量管理方法,能够有效解决现有技术中在海量的数据出现异常时,如何对海量数据质量风险管控的问题
。
[0004]为实现以上目的,本专利技术通过以下技术方案予以实现:本专利技术提供一种基于人工智能技术的数据质量管理方法,包括如下方法步骤:
S1、
抽取指定时 ...
【技术保护点】
【技术特征摘要】
1.
一种基于人工智能技术的数据质量管理方法,其特征在于,包括如下方法步骤:
S1、
抽取指定时间下数据库内的部分数据,并将所抽取的数据设为一次抽调数据;
S2、
分析判定一次抽调数据是否异常,当判定为异常时,确定一次抽调数据所对应的责任编号,基于责任编号在数据库内重新抽取部分数据,并设为二次抽调数据,再次判定其是否为异常,结合一次抽调数据与二次抽调数据的抽调结果判定责任编号的风险等级;
S3、
基于风险等级划定责任编号的监管方式,并依据责任编号在监管方式下后续对应数据的异常状况,以判定是否执行风险等级调控操作,以重新判定责任编号的风险等级
。2.
根据权利要求1所述的一种基于人工智能技术的数据质量管理方法,其特征在于,所述指定时间包括:周度
、
月度和季度
。3.
根据权利要求1所述的一种基于人工智能技术的数据质量管理方法,其特征在于,所述判定一次抽调数据和二次抽调数据是否异常时,依据如下方法进行判定:数据是否存在缺失
、
无效
、
重复及异项特征,其中:数据的异项通过
Z
‑
score
算法进行判定,其算法步骤如下:步骤一:采集与指定时间数据库内抽调数据对应的历史数据;步骤二:求取均值:式中:为历史数据的平均值,均为历史数据,
n
为历史数据的总天数;步骤三:求取标准差:式中:为历史数据的标准差,为第
i
个历史数据;步骤四:设定阈值常数,基于
Z
‑
score
算法进行判定:式中:
Z
‑
score
为判定值,为当前抽取的变量数据,判定
Z
‑
score
是否大于阈值常数,当其大于阈值常数时,为异常,并基于对异常的数据执行修正操作,当其小于等于阈值常数时,为正常
。4.
根据权利要求1所述的一种基于人工智能技术的数据质量管理方法,其特征在于,所述风险等级包括一级
、
二级和三级,且一级
、
二级和三级的风险等级由高至低序列,其中,风险等级的判定方式如下:当一次抽调数据为异常,责任编号对应的风险等级为三级;当一次抽调数据和二次抽调数据均为异常,责任编号对应的风险等级为二级,并设定责任编号监管方式;当责任编号经过...
【专利技术属性】
技术研发人员:李保平,谢超,杨建荣,陈木辉,麦新伟,黄月梅,戴思敏,
申请(专利权)人:广州汇通国信科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。