用于数据库审计系统的SQL新语句识别方法及装置制造方法及图纸

技术编号：28144586 阅读：24 留言：0更新日期：2021-04-21 19:26

本发明专利技术公开一种用于数据库审计系统的SQL新语句识别方法及装置，涉及大数据技术领域，能够有效降低数据库审计系统的资源占用量，进而提升系统性能。该方法包括：接收网络报文中的SQL语句，模块化处理后提取主干语句；针对主干语句进行摘要计算，并将摘要值转换处理成整型值；利用整型值查表比对，并基于比对结果识别SQL语句是否为SQL新语句。该装置应用有上述方案所提的方法。方案所提的方法。方案所提的方法。

全部详细技术资料下载

【技术实现步骤摘要】
用于数据库审计系统的SQL新语句识别方法及装置

[0001]本专利技术涉及大数据
，尤其涉及一种用于数据库审计系统的SQL新语句识别方法及装置。

技术介绍

[0002]数据库审计系统主要用于审计数据库服务器上的各类操作行为，通过旁路镜像或者安装插件的方式获取数据库服务器的网络报文，然后提取报文中的SQL语句保存到数据库审计系统的数据库中，以便后续进行查询、过滤、分析等操作，从而实现对数据库服务器的监控和审计。
[0003]数据库审计系统通过分析提取的SQL语句，判断被审计的数据库服务器是否存在漏洞或者被攻击行为。从技术实现角度看就是对SQL语句的提取、分析、保存，其中分析就是审计SQL语句是否存在漏洞或者攻击。为了确保审计的准确性，审计系统需要分析所有的SQL语句，随着审计系统部署的数据库服务器的数量越来越多，被审计的数据库业务流量流越来越大，已有的软硬件平台已经不能满足需求。
[0004]经过分析发现，在实际的业务流量中，有很多SQL语句都是相同的，另外还有一些语句的语法主干相同，只是参数值不同而已。以上这类相同的语句在审计系统中其实只需要分析一次，假设数据库审计系统只处理这些不同的SQL语句，那它只需要很小的一部分流量。这就需要审计系统在进行SQL分析前就能识别出哪些语句是首次出现的。
[0005]常用的几种识别SQL语句的方法主要有：字符匹配、AI识别、SQL语义解析等。上述几种方法都有一定的弊端，比如字符匹配无法忽略不同参数值，如ID＝3和ID＝4，字符匹配会认为这是两条语句，无...

【技术保护点】

【技术特征摘要】
1.一种用于数据库审计系统的SQL新语句识别方法，其特征在于，包括：接收网络报文中的SQL语句，模块化处理后提取主干语句；针对所述主干语句进行摘要计算，并将摘要值转换处理成整型值；利用所述整型值查表比对，并基于比对结果识别所述SQL语句是否为SQL新语句。2.根据权利要求1所述的方法，其特征在于，模块化处理后提取主干语句的方法包括：识别所述SQL语句中的SQL语法关键字，剔除所述SQL语句中除SQL语法关键字之外的内容得到所述主干语句。3.根据权利要求1或2所述的方法，其特征在于，针对所述主干语句进行摘要计算之前还包括：识别所述主干语句中是否存在组合值；若存在则对组合值进行合并处理，再对其中的参数值采用通用字符替换进行去值处理；若不存在，则直接对其中的参数值采用通用字符替换进行去值处理；所述参数值包括变量参数和/或字符串。4.根据权利要求1或3所述的方法，其特征在于，针对所述主干语句进行摘要计算之前还包括：将所述主干语句的非ascii码采用通用字符进行替换处理。5.根据权利要求3或4所述的方法，其特征在于，针对所述主干语句进行摘要计算，并将摘要值转换处理得到整型值的方法包括：采用MD5算法对处理后的所述主干语句进行摘要计算，得到摘要值；从所述摘要值中提取固定位置的部分字节数据，采用整型算法转化成整型值。6.根据权利要求5所述的方法，其特征在于，利用所述整型值查表比对，并基于比对结果识别所述SQL语句是否为SQL新语句的方法包括：所述表中包括多个与主干语句一一对应的key
‑
value键值对，所述key值为对应主干语句的整型值，所述value值为对应S...

【专利技术属性】
技术研发人员：韦建明，葛毅，李宗霖，
申请(专利权)人：江苏苏宁云计算有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人