用于识别数据的方法和装置制造方法及图纸

技术编号:31307735 阅读:12 留言:0更新日期:2021-12-12 21:29
本申请公开了用于识别数据的方法和装置,具体实现方案为:响应于接收到客户端发送的用户访问请求,解析用户访问请求,得到用户标识、访问地址、为请求提供的各个服务应用;基于访问地址和各个服务应用,生成链路追踪标识;基于链路追踪标识,从数据库中获取各个服务应用的应用信息,其中,应用信息包括:接口信息和执行代码,数据库利用链路追踪标识预先更新得到;基于用户标识和各个服务应用的接口信息,生成各个服务应用的权限资源码;对各个服务应用的权限资源码进行识别,得到各个权限资源码所表征的各个敏感数据和各个敏感数据对应的数据类型。该方案实现了一种自动识别出权限资源码所表征的敏感数据以及敏感数据类型的数据识别方法。据识别方法。据识别方法。

【技术实现步骤摘要】
用于识别数据的方法和装置


[0001]本申请的实施例涉及计算机
,具体涉及数据处理
,尤其涉及用于识别数据的方法和装置。

技术介绍

[0002]权限平台是一个标准的基于角色的访问控制(简称RBAC)权限管理平台,需要权限控制的业务应用到权限平台注册、申请权限资源码,然后通过角色管理资源码权限。
[0003]目前,权限平台无法识别权限资源码背后代表了哪些敏感数据,权限审批人也没有审批依据,只能靠申请人写的申请理由和自己的经验进行判断,权限管理和审查比较困难。通过http报文流量数据不知道流量中的URL即访问地址关联的哪个后端应用以及后端应用对应的权限资源码是哪个,资产定位困难,敏感数据在哪比较模糊,很难做到重点保护。

技术实现思路

[0004]本申请提供了一种用于识别数据的方法、装置、设备以及存储介质。
[0005]根据本申请的第一方面,提供了一种用于识别数据的方法,该方法包括:响应于接收到客户端发送的用户访问请求,解析用户访问请求,得到请求对应的用户标识、访问地址、为请求提供的各个服务应用;基于访问地址和各个服务应用,生成与访问标识和各个服务应用对应的链路追踪标识,其中,链路追踪标识用于表征访问地址与各个服务应用之间的关联关系;基于链路追踪标识,从数据库中获取各个服务应用的应用信息,其中,应用信息包括:接口信息和执行代码,数据库利用链路追踪标识预先更新得到;基于用户标识和各个服务应用的接口信息,生成与各个接口信息对应的各个服务应用的权限资源码,其中,权限资源码用于表征对请求进行权限校验所用的资源信息;对各个服务应用的权限资源码进行识别,得到各个权限资源码所表征的各个敏感数据和各个敏感数据对应的数据类型,其中,识别用于表征将各个服务应用的执行代码与数据库元数据中针对敏感数据的分类数据进行比对。
[0006]在一些实施例中,数据库的更新过程如下:将链路追踪标识与获取到的各个服务应用对应的应用信息进行绑定,生成绑定后的各个服务应用对应的接口信息和绑定后的各个服务应用对应的执行代码;基于绑定后的各个服务应用对应的接口信息和绑定后的各个服务应用对应的执行代码,对数据库进行更新。
[0007]在一些实施例中,将链路追踪标识与获取到的各个服务应用对应的应用信息进行绑定,生成绑定后的各个服务应用对应的接口信息和绑定后的各个服务应用对应的执行代码,包括:基于链路追踪技术,将链路追踪标识与各个服务应用对应的应用信息进行绑定,生成绑定后的各个服务应用对应的接口信息和绑定后的各个服务应用对应的执行代码,其中,链路追踪技术用于表征利用埋点技术在各个服务应用对应的应用信息的相应位置进行埋点。
[0008]在一些实施例中,对各个服务应用的权限资源码进行识别,得到各个权限资源码所表征的各个敏感数据和各个敏感数据对应的数据类型,包括:对各个服务应用的执行代码进行提取,得到各个服务应用的执行代码对应的特征数据集;对各个服务应用的权限资源码进行识别,得到各个权限资源码所表征的各个敏感数据和各个敏感数据对应的数据类型,其中,识别用于表征将各个特征数据集中的特征数据与数据库元数据针对敏感数据的分类数据进行比对。
[0009]在一些实施例中,对各个服务应用的权限资源码进行识别,得到各个权限资源码所表征的各个敏感数据和各个敏感数据对应的数据类型,包括:将各个服务应用的权限资源码输入至训练得到的数据识别模型,生成各个权限资源码所表征的各个敏感数据和与各个敏感数据对应的数据类型,其中,数据识别模型用于表征对权限资源码所表征数据是否存在敏感数据和敏感数据的数据类型进行判定。
[0010]在一些实施例中,方法还包括:将链路追踪标识发送至客户端。
[0011]在一些实施例中,方法还包括:基于各个权限资源码所表征的各个敏感数据与权限审查的相关性,优化权限审查策略。
[0012]根据本申请的第二方面,提供了一种用于识别数据的装置,装置包括:第一获取单元,被配置成响应于接收到客户端发送的用户访问请求,获取请求对应的用户标识、访问地址、为请求提供的各个服务应用;第一生成单元,被配置成基于访问地址和各个服务应用,生成与访问标识和各个服务应用对应的链路追踪标识,其中,链路追踪标识用于表征访问地址与各个服务应用之间的关联关系;第二获取单元,被配置成基于链路追踪标识,从数据库中获取各个服务应用的应用信息,其中,应用信息包括:接口信息和执行代码,数据库利用链路追踪标识预先更新得到;第二生成单元,被配置成基于用户标识和各个服务应用的接口信息,生成与各个接口信息对应的各个服务应用的权限资源码,其中,权限资源码用于表征对请求进行权限校验所用的资源信息;数据识别单元,被配置成对各个服务应用的权限资源码进行识别,得到各个权限资源码所表征的各个敏感数据和各个敏感数据对应的数据类型,其中,识别用于表征将各个服务应用的执行代码与数据库元数据中针对敏感数据的分类数据进行比对。
[0013]在一些实施例中,数据库的更新过程通过如下模块完成:生成模块,被配置成将链路追踪标识与获取到的各个服务应用对应的应用信息进行绑定,生成绑定后的各个服务应用对应的接口信息和绑定后的各个服务应用对应的执行代码;更新模块,被配置成基于绑定后的各个服务应用对应的接口信息和绑定后的各个服务应用对应的执行代码,对数据库进行更新。
[0014]在一些实施例中,生成模块进一步配置成基于链路追踪技术,将链路追踪标识与各个服务应用对应的应用信息进行绑定,其中,链路追踪技术用于表征利用埋点技术在各个服务应用对应的应用信息的相应位置进行埋点。
[0015]在一些实施例中,数据识别单元,包括:提取模块,被配置成对各个服务应用的执行代码进行提取,得到各个服务应用的执行代码对应的特征数据集;识别模块,被配置成对各个服务应用的权限资源码进行识别,得到各个权限资源码所表征的各个敏感数据和各个敏感数据对应的数据类型,其中,识别用于表征将各个特征数据集中的特征数据与数据库元数据针对敏感数据的分类数据进行比对。
[0016]在一些实施例中,数据识别单元进一步被配置成将各个服务应用的权限资源码输入至训练得到的数据识别模型,生成各个权限资源码所表征的各个敏感数据和与各个敏感数据对应的数据类型,其中,数据识别模型用于表征对权限资源码所表征数据是否存在敏感数据和敏感数据的数据类型进行判定。
[0017]在一些实施例中,装置还包括:发送单元,被配置成将链路追踪标识发送至客户端。
[0018]在一些实施例中,装置还包括:优化单元,被配置成基于各个权限资源码所表征的各个敏感数据与权限审查的相关性,优化权限审查策略。
[0019]根据本申请的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。
[0020]根据本申请的第四方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于识别数据的方法,所述方法包括:响应于接收到客户端发送的用户访问请求,解析所述用户访问请求,得到所述请求对应的所述用户标识、访问地址、为所述请求提供的各个服务应用;基于所述访问地址和所述各个服务应用,生成与所述访问标识和所述各个服务应用对应的链路追踪标识,其中,所述链路追踪标识用于表征所述访问地址与所述各个服务应用之间的关联关系;基于所述链路追踪标识,从数据库中获取所述各个服务应用的应用信息,其中,所述应用信息包括:接口信息和执行代码,所述数据库利用所述链路追踪标识预先更新得到;基于所述用户标识和所述各个服务应用的接口信息,生成与各个接口信息对应的所述各个服务应用的权限资源码,其中,所述权限资源码用于表征对所述请求进行权限校验所用的资源信息;对所述各个服务应用的权限资源码进行识别,得到各个所述权限资源码所表征的各个敏感数据和各个所述敏感数据对应的数据类型,其中,所述识别用于表征将所述各个服务应用的执行代码与所述数据库元数据中针对敏感数据的分类数据进行比对。2.根据权利要求1所述的方法,其中,所述数据库的更新过程如下:将所述链路追踪标识与获取到的所述各个服务应用对应的所述应用信息进行绑定,生成绑定后的所述各个服务应用对应的接口信息和绑定后的所述各个服务应用对应的执行代码;基于绑定后的所述各个服务应用对应的接口信息和绑定后的所述各个服务应用对应的执行代码,对所述数据库进行更新。3.根据权利要求2所述的方法,其中,所述将所述链路追踪标识与获取到的所述各个服务应用对应的所述应用信息进行绑定,生成绑定后的所述各个服务应用对应的接口信息和绑定后的所述各个服务应用对应的执行代码,包括:基于链路追踪技术,将所述链路追踪标识与所述各个服务应用对应的所述应用信息进行绑定,生成绑定后的所述各个服务应用对应的接口信息和绑定后的所述各个服务应用对应的执行代码,其中,所述链路追踪技术用于表征利用埋点技术在所述各个服务应用对应的所述应用信息的相应位置进行埋点。4.根据权利要求1所述的方法,其中,所述对所述各个服务应用的权限资源码进行识别,得到各个所述权限资源码所表征的各个敏感数据和各个所述敏感数据对应的数据类型,包括:对所述各个服务应用的执行代码进行提取,得到所述各个服务应用的执行代码对应的特征数据集;对所述各个服务应用的权限资源码进行识别,得到各个所述权限资源码所表征的各个敏感数据和各个所述敏感数据对应的数据类型,其中,所述识别用于表征将各个特征数据集中的特征数据与所述数据库元数据针对敏感数据的分类数据进行比对。5.根据权利要求1所述的方法,其中,所述对所述各个服务应用的权限资源码进行识别,得到各个所述权限资源码所表征的各个敏感数据和各个所述敏感数据对应的数据类型,包括:将所述各个服务应用的权限资源码输入至训练得到的数据识别模型,生成各个所述权
限资源码所表征的各个敏感数据和与各个所述敏感数据对应的数据类型,其中,所述数据识别模型用于表征对所述权限资源码所表征数据是否存在敏感数据和所述敏感数据的数据类型进行判定。6.根据权利要求1所述的方法,还包括:将所述链路追踪标识发送至所述客户端。7.根据权利要求1所述的方法,还包括:基于各个所述权限资源码所表征的各个敏感数据与权限审查的相关性,优化权限审查策略。8.一种用于识别数据的装置,所述装置包括:第一获取单元,被配置成响应于接收到客户端发送的用户访问请求,获取所述请求对应的所述...

【专利技术属性】
技术研发人员:李长伟方城
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1