当前位置: 首页 > 专利查询>浙江大学专利>正文

一种面向审计的关系数据库聚合代数约束自动挖掘方法技术

技术编号:26222735 阅读:70 留言:0更新日期:2020-11-04 10:53
本发明专利技术公开了一种面向审计的关系数据库聚合代数约束自动挖掘方法,它是一种智慧审计应用中潜藏于海量数据之中的约束关系挖掘方法。现有的审计规则或由专家构造,或由数据库约束发现方法产生,能实现审计简单业务的目的,但是不足以应付海量数据规模挑战,无法满足审计作业中含统计数值的复杂运算的需求。本发明专利技术针对上述不足,将该需求形式化成聚合代数约束,并提供聚合代数约束的挖掘方法,该方法根据数据库的模式信息依次枚举表连接、分组方式和代数表达式,计算分析后得到聚合代数约束。本发明专利技术无需人工参与约束挖掘,可以应对计算海量数据带来的时空性能挑战,满足审计统计数值相关的复杂运算需求。

【技术实现步骤摘要】
一种面向审计的关系数据库聚合代数约束自动挖掘方法
本专利技术涉及智慧审计应用中的审计规则挖掘领域,尤其涉及一种面向审计的关系数据库聚合代数约束自动挖掘方法。
技术介绍
在现实生活的审计作业中,审计员根据审计实务指南和专家经验开展审计工作。通常,审计过程能否顺利实施的关键在于审计员能否根据业务规则发现对应数据表中存在的模糊约束,即作用于数据表中的大多数而非全部记录之间的约束,这些约束即可作为审计规则,在审计工作中发挥重要作用。例如,“约束c1:Sum(收入)=Sum(支出)”和“约束c2:交通费+住宿费<1000”是较为简单的模糊约束,可以由审计员凭借专家经验给出,然后将其作为审计规则逐一检查数据记录是否违例。然而,审计员很难发现潜藏着的复杂约束,如“约束c3:Avg(住宿费)+Avg(杂费)∈[1000,2000]∪[3000,5000]GroupBy部门”表明按照部门字段对报销记录进行分组,大多数部门的平均住宿费和平均杂费之和在特定的区间[1000,2000]以及[3000,5000]之内。审计员之所以难以通过专家经验给出类似约束c3的模糊约本文档来自技高网...

【技术保护点】
1.一种面向审计的关系数据库聚合代数约束自动挖掘方法,其特征在于,所述聚合代数约束定义如下:给定关系数据库D,聚合代数约束是一个作用于D中部分记录上的八元组:/n

【技术特征摘要】
1.一种面向审计的关系数据库聚合代数约束自动挖掘方法,其特征在于,所述聚合代数约束定义如下:给定关系数据库D,聚合代数约束是一个作用于D中部分记录上的八元组:



其中,a1、a2是D中的两个属性字段,来自同一张数据表或来自两张不同的数据表;f1、f2是分别施加在属性a1、a2上的聚合函数,所述聚合函数选自Count、Sum、Avg、Max和Min;二元运算符是f1(a1)和f2(a2)间的代数运算符,包括+、-、×和/;I=Ii∪...∪Ij为的值域集合,其中Ii∈I是一个实数闭区间[a,b],且I中任意两个区间Ii、Ij满足如果a1、a2来自不同数据表,配对规则p指定数据表间的连接条件;g是分组规则,语义上等同于SQL的GroupBy语句,指定与聚合运算相关的分组字段列。定义形式化地表明聚合代数约束是a1、a2在条件p、g下,使用函数f1、f2进行运算后产生的值域集合I约束。
该方法包括以下步骤:
(1)获取数据库的模式信息:根据给定的关系数据库D,获...

【专利技术属性】
技术研发人员:江大伟陈珂张效伟陈刚寿黎但伍赛胡天磊
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1