【技术实现步骤摘要】
一种面向审计的关系数据库聚合代数约束自动挖掘方法
本专利技术涉及智慧审计应用中的审计规则挖掘领域,尤其涉及一种面向审计的关系数据库聚合代数约束自动挖掘方法。
技术介绍
在现实生活的审计作业中,审计员根据审计实务指南和专家经验开展审计工作。通常,审计过程能否顺利实施的关键在于审计员能否根据业务规则发现对应数据表中存在的模糊约束,即作用于数据表中的大多数而非全部记录之间的约束,这些约束即可作为审计规则,在审计工作中发挥重要作用。例如,“约束c1:Sum(收入)=Sum(支出)”和“约束c2:交通费+住宿费<1000”是较为简单的模糊约束,可以由审计员凭借专家经验给出,然后将其作为审计规则逐一检查数据记录是否违例。然而,审计员很难发现潜藏着的复杂约束,如“约束c3:Avg(住宿费)+Avg(杂费)∈[1000,2000]∪[3000,5000]GroupBy部门”表明按照部门字段对报销记录进行分组,大多数部门的平均住宿费和平均杂费之和在特定的区间[1000,2000]以及[3000,5000]之内。审计员之所以难以通过专家经验给出 ...
【技术保护点】
1.一种面向审计的关系数据库聚合代数约束自动挖掘方法,其特征在于,所述聚合代数约束定义如下:给定关系数据库D,聚合代数约束是一个作用于D中部分记录上的八元组:/n
【技术特征摘要】
1.一种面向审计的关系数据库聚合代数约束自动挖掘方法,其特征在于,所述聚合代数约束定义如下:给定关系数据库D,聚合代数约束是一个作用于D中部分记录上的八元组:
其中,a1、a2是D中的两个属性字段,来自同一张数据表或来自两张不同的数据表;f1、f2是分别施加在属性a1、a2上的聚合函数,所述聚合函数选自Count、Sum、Avg、Max和Min;二元运算符是f1(a1)和f2(a2)间的代数运算符,包括+、-、×和/;I=Ii∪...∪Ij为的值域集合,其中Ii∈I是一个实数闭区间[a,b],且I中任意两个区间Ii、Ij满足如果a1、a2来自不同数据表,配对规则p指定数据表间的连接条件;g是分组规则,语义上等同于SQL的GroupBy语句,指定与聚合运算相关的分组字段列。定义形式化地表明聚合代数约束是a1、a2在条件p、g下,使用函数f1、f2进行运算后产生的值域集合I约束。
该方法包括以下步骤:
(1)获取数据库的模式信息:根据给定的关系数据库D,获...
【专利技术属性】
技术研发人员:江大伟,陈珂,张效伟,陈刚,寿黎但,伍赛,胡天磊,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。