数据识别方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:39152084 阅读:17 留言:0更新日期:2023-10-23 14:59
本发明专利技术涉及数据处理技术领域,并公开了一种数据识别方法、装置、存储介质及计算机设备,其中方法包括:响应于数据识别请求,获取数据识别请求中的数据筛选规则,并基于数据筛选规则在源数据表中提取出待识别数据,然后确定待识别数据的多个待识别指标项以及对应的识别算法,再基于识别算法对待识别指标项的字段内容进行识别得到识别结果,最终将多个识别结果代入数据匹配计算公式中进行计算,得到计算结果,并根据计算结果确定待识别数据的数据类别。上述方法提升数据识别效率,并结合多个维度来识别数据,提升数据的识别精度,准确获取数据的敏感度识别结果,实现对敏感数据内容精准的分类与管控。准的分类与管控。准的分类与管控。

【技术实现步骤摘要】
数据识别方法、装置、存储介质及计算机设备


[0001]本专利技术涉及数据处理
,尤其是涉及一种数据识别方法、装置、存储介质及计算机设备。

技术介绍

[0002]随着各行业对于数据分类分级逐渐规范化、标准化管理,以及伴随着数据安全保护法的实施,各企业对于数据库内所存储的数据愈发关注,尤其是对一些涉及到敏感内容的数据不断加大关注力度。而为了更好地对存储的数据进行分类分级,需要预先对数据内容的敏感度进行精准识别,才能做到对数据的合理管控。
[0003]现有技术中,对于存储数据敏感度的识别还只停留在基于数据内容进行初步识别与判断,或是对数据内容进行二维复合规则的简单判定,但以上两种方式在对大批量的数据进行敏感度识别时存在数据识别效率低下的问题、并且获取到的数据敏感度识别结果容易产生误差,无法准确识别出敏感数据,进而无法做到对存储的数据进行精准识别与分类。

技术实现思路

[0004]有鉴于此,本申请提供的数据识别方法、装置、存储介质及计算机设备,主要目的在于解决现有技术中对敏感数据的识别方法识别效率低、识别结果精准度低的技术问题。
[0005]根据本专利技术的第一个方面,提供了一种数据识别方法,该方法包括:
[0006]响应于数据识别请求,获取所述数据识别请求中携带的数据筛选规则,并基于所述数据筛选规则在源数据表中提取出待识别数据;
[0007]确定所述待识别数据的多个待识别指标项,并获取每一所述待识别指标项对应的识别算法;
[0008]基于所述识别算法对所述待识别数据的每一所述待识别指标项的字段内容进行识别,得到所述待识别数据的每一所述待识别指标项对应的识别结果;
[0009]将所述待识别数据的多个所述识别结果输入到预设的规则匹配计算表达式中进行计算,得到计算结果,并根据所述计算结果确定所述待识别数据的敏感度识别结果。
[0010]根据本专利技术的第二个方面,提供了一种数据识别装置,该装置包括:
[0011]数据提取模块,用于响应于数据识别请求,获取所述数据识别请求中携带的数据筛选规则,并基于所述数据筛选规则在源数据表中提取出待识别数据;
[0012]算法确认模块,用于确定所述待识别数据的多个待识别指标项,并获取每一所述待识别指标项对应的识别算法;
[0013]数据识别模块,用于基于所述识别算法对所述待识别数据的每一所述待识别指标项的字段内容进行识别,得到所述待识别数据的每一所述待识别指标项对应的识别结果;
[0014]结果输出模块,用于将所述待识别数据的多个所述识别结果输入到预设的规则匹配计算表达式中进行计算,得到计算结果,并根据所述计算结果确定所述待识别数据的敏感度识别结果。
[0015]根据本专利技术的第三个方面,提供了一种存储介质,其上存储有计算机程序,程序被处理器执行时实现上述数据识别方法。
[0016]根据本专利技术的第四个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述数据识别方法。
[0017]本专利技术提供的一种数据识别方法、装置、存储介质及计算机设备,本申请首先响应于数据识别请求,获取数据识别请求中携带的数据筛选规则,并基于数据筛选规则在源数据表中提取出待识别数据,然后确定待识别数据的多个待识别指标项,并获取每一待识别指标项对应的识别算法,之后基于识别算法对待识别数据的每一待识别指标项的字段内容进行识别,得到待识别数据的每一待识别指标项对应的识别结果,最终将待识别数据的多个识别结果输入到预设的规则匹配计算表达式中进行计算,得到计算结果,并根据计算结果确定待识别数据的敏感度识别结果。
[0018]上述方法在对数据进行识别处理之前,预先基于数据识别请求中的数据筛选规则对源数据表中的数据进行筛选,获取到真正需要进行识别的数据,当待识别数据的数据量较大时,此方法能够对大批量数据快速进行初步筛选,有效提升数据处理的效率;之后确定待识别数据的多个待识别指标项,并基于每个待识别指标项的识别算法逐一对每个待识别指标项的字段内容进行针对性的识别,从多个指标维度对数据进行识别,能够更加全面地了解数据,并且准确获取每一指标维度下数据的识别结果;最后将每个待识别指标项的识别结果通过规则匹配计算表达式进行计算,基于多个指标维度之间的计算结果确定待识别数据的敏感度识别结果,提升了数据识别率,最终得到待识别数据的数据分类结果,准确识别出敏感数据。上述方法能够提升数据识别的效率,尤其能够对大批量的复杂数据准确识别,并且结合多个维度来识别数据,有效提升数据的识别精度,准确得到数据的敏感度识别结果,实现对敏感数据内容精准的分类与管控。
[0019]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0020]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0021]图1示出了本专利技术提供的一种实施例中数据识别方法的流程示意图;
[0022]图2示出了本专利技术提供的一种实施例中数据识别方法的流程示意图;
[0023]图3示出了本专利技术提供的一种实施例中数据识别方法的原理流程图;
[0024]图4示出了本专利技术提供的一种实施例中数据识别装置的结构示意图;
[0025]图5示出了本专利技术提供的一种实施例中数据识别装置的结构示意图;
[0026]图6示出了本专利技术提供的一种实施例中计算机设备的装置结构示意图。
具体实施方式
[0027]下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例
所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
[0028]本申请实施例提供了一种数据识别方法,如图1所示,该方法包括以下步骤:
[0029]101、响应于数据识别请求,获取数据识别请求中携带的数据筛选规则,并基于数据筛选规则在源数据表中提取出待识别数据。
[0030]具体地,数据筛选规则具体是指根据特定的条件来筛选出需要进行识别或分析的数据,而特定条件可以是数值范围、日期范围、或某一列数据中的特定值等等,利用数据筛选规则能够在对数据识别前预先确定目标数据,有效提升数据识别的效率。
[0031]进而本申请提出一种数据识别方法,首先响应于用户发送的数据识别请求,其中,数据识别请求中携带有数据筛选规则,而数据筛选规则具体可以由用户自行编辑设定,也可以选用预先存储好的规则,但无论是何种实现形式,数据筛选规则能够帮助用户在处理大批量的数据中快速筛选出需要进行识别的数据,从而提高数据识别效率。而数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据识别方法,其特征在于,所述方法包括:响应于数据识别请求,获取所述数据识别请求中携带的数据筛选规则,并基于所述数据筛选规则在源数据表中提取出待识别数据;确定所述待识别数据的多个待识别指标项,并获取每一所述待识别指标项对应的识别算法;基于所述识别算法对所述待识别数据的每一所述待识别指标项的字段内容进行识别,得到所述待识别数据的每一所述待识别指标项对应的识别结果;将所述待识别数据的多个所述识别结果输入到预设的规则匹配计算表达式中进行计算,得到计算结果,并根据所述计算结果确定所述待识别数据的敏感度识别结果。2.根据权利要求1所述的方法,其特征在于,所述源数据表包括多条数据记录,每条所述数据记录包括多个数据指标项;所述基于所述数据筛选规则在源数据表中提取出待识别数据,包括:获取所述数据筛选规则,并确定所述数据筛选规则中的数据筛选条件,其中,所述数据筛选条件包括判定指标项和判定条件;将所述判定指标项与多个所述数据指标项逐一进行匹配,提取与所述判定指标项相同的所述数据指标项;根据所述判定指标项对应的所述判定条件对所述数据指标项的字段内容进行判定,若所述数据指标项的字段内容满足所述判定条件,则确定所述数据指标项对应的所述数据记录满足所述数据筛选条件,并将所述数据记录标记为待识别数据。3.根据权利要求2所述的方法,其特征在于,所述数据筛选条件的数量为多个;所述若所述数据指标项的字段内容满足所述判定条件,则确定所述数据指标项对应的所述数据记录满足所述数据筛选条件,并将所述数据记录标记为待识别数据,包括:基于多个所述数据筛选条件逐一对所述源数据表内的多条所述数据记录进行筛选;当存在所述数据记录同时满足全部所述数据筛选条件时,提取所述数据记录,并对所述数据记录进行冗余处理;对冗余处理后的所述数据记录进行整合,并将整合后的所述数据记录标记为待识别数据。4.根据权利要求1所述的方法,其特征在于,所述待识别指标项包括定性指标项和定量指标项;所述确定所述待识别数据的多个待识别指标项,包括:获取所述待识别数据的源数据表信息,根据所述源数据表信息生成元数据指标项;获取所述待识别数据的数据指标项,将所述元数据指标项与所述数据指标项进行整合,得到所述待识别数据的定性指标项;获取所述待识别数据中每一所述数据指标项的字段内容,并基于预设的统计算法对所述字段内容进行统计计算,得到统计结果;基于所述统计结果,生成所述待识别数据的定量指标项。5.根据权利要求1所述的方法,其特征在于,所述基于所述识别算法对所述待识别数据的每一所述待识别指标项...

【专利技术属性】
技术研发人员:衡相忠汪争起胡绍勇王亭景胡理兵陆彬
申请(专利权)人:上海观安信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1