基于大数据的数据安全管控方法、装置、设备及存储介质制造方法及图纸

技术编号:36543205 阅读:11 留言:0更新日期:2023-02-01 16:47
本发明专利技术涉及人工智能技术,揭露了一种基于大数据的数据安全管控方法,包括:对目标单位原始数据进行压缩及分段处理,并筛选分段后数据,得到目标数据,对目标数据进行特征融合,得到融合数据;根据预设第三方权威数据的业务类别,选择预设分类模型对预设第三方权威数据进行分类,得到分类数据;利用预设第一及二鉴别模型,对融合数据及分类数据进行安全性检测,得到初步检测结果及第三方数据可靠性检测结果;检测结果均为合格时,根据分类数据,利用预设第三鉴别模型检测融合数据的安全性,得到安全数据及异常数据。本发明专利技术还提出一种基于大数据的数据安全管控装置、电子设备以及存储介质。本发明专利技术可以提高数据安全性。本发明专利技术可以提高数据安全性。本发明专利技术可以提高数据安全性。

【技术实现步骤摘要】
基于大数据的数据安全管控方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于大数据的数据安全管控方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]大数据及人工智能时代,外部数据在服务消费金融业务数字化转型中的重要性愈加凸显。在外部数据实际落地运用时会遇到各种各样的问题,例如,多部门各自引入数据,数据管理标准的不统,导致数据安全得不到保障。
[0003]目前,各个政府机构、事业单位之间的业务数据是相互独立的,受理业务的机构也无法直接在别的机构的数据库中查看原始数据进行核对,只能凭借材料上的盖章等证明物来对材料的真实性进行判断,并且随着网络技术的高速发展,目前的材料造假技术也越来越高级,仅从盖章等证明物判断材料的真实性,即使对材料进行了造假或者篡改,受理机构的工作人员也难以进行甄别,且由于不同部门的需要保护的数据不同,但是一般为了方便会直接使用相同系统对数据进行真伪鉴别以及对数据进行保护,针对性较低,进而使得辨别结果或者是安全保护达不到预期效果,导致数据安全性不高。

技术实现思路

[0004]本专利技术提供一种基于大数据的数据安全管控方法、装置及计算机可读存储介质,其主要目的在于解决数据安全性较低的问题。为实现上述目的,本专利技术提供的一种基于大数据的数据安全管控方法,包括:
[0005]获取目标单位原始数据及预设第三方权威数据;
[0006]对所述目标单位原始数据进行压缩及分段处理,并筛选分段后数据,得到目标数据,对所述目标数据进行特征融合,得到融合数据,并将所述融合数据转换为预设格式存储至预设数据库;
[0007]识别所述预设第三方权威数据的业务类别,根据所述业务类别选择预设分类模型对所述预设第三方权威数据进行分类,得到分类数据;
[0008]利用预设第一鉴别模型,对所述融合数据进行规范性检查及安全审计操作,得到初步检测结果;
[0009]利用预设第二鉴别模型检测所述分类数据来源可靠性,得到第三方数据可靠性检测结果;
[0010]当所述初步检测结果及所述第三方数据可靠性检测结果均为合格时,根据所述分类数据,利用预设第三鉴别模型检测所述融合数据的安全性,得到安全数据及异常数据,按照标准管控方式管控所述安全数据,按照集中管控方式管控所述异常数据。
[0011]可选地,所述对所述目标单位原始数据进行压缩及分段处理,并筛选分段后数据,得到目标数据,包括:
[0012]对所述目标单位原始数据进行压缩,得到压缩数据;
[0013]将所述压缩数据分段为多个目标待筛选数据段;
[0014]计算各个目标待筛选数据段的准确率,根据所述准确率对所述多个目标待筛选数据段进行初步筛选,得到初筛数据段;
[0015]根据所述准确率计算所述初筛数据段的校验值;
[0016]根据所述校验值及预设校验阈值,判断所述初筛数据段是否合格;
[0017]当所述初筛数据段不合格时,识别不合格初筛数据段的所属目标单位,重新采集目标单位原始数据,并返回所述对所述目标单位原始数据进行压缩,得到压缩数据的步骤,直至所述初筛数据段合格;
[0018]当所述初筛数据段合格时,将合格的初筛数据段作为目标数据。
[0019]可选地,所述根据所述准确率计算所述初筛数据段的校验值,包括:
[0020]提取所述初筛数据段及所述目标待筛选数据段的平均特征值;
[0021]统计所述初筛数据段及所述目标待筛选数据段的数据总量;
[0022]根据所述初筛数据段的平均特征值、所述目标待筛选数据段的平均特征值、所述目标待筛选数据段的数据总量、所述初筛数据段的数据总量及所述初筛数据段的准确率,计算所述初筛数据段的校验值。
[0023]可选地,所述对所述目标数据进行特征融合,得到融合数据,包括:
[0024]利用预构建特征关系标识模型对所述目标数据进行特征关系标识,得到所述目标数据的数据特征;
[0025]对所述数据特征进行数据结构化处理,得到结构化数据组;
[0026]计算所述结构化数据组中数据之间的相似度;
[0027]将所述相似度值大于预设相似度阈值的数据进行融合操作,得到融合数据。
[0028]可选地,所述根据所述业务类别选择预设分类模型对所述预设第三方权威数据进行分类,得到分类数据,包括:
[0029]获取所述预设分类模型中的多个决策树及每个决策树中至少一层节点的决策维度索引和决策条件;
[0030]根据所述预设分类模型中第一节点的决策维度索引,对所述预设第三方权威数据进行特征提取,得到所述预设第三方权威数据在所述第一节点的分裂维度上的特征值;
[0031]根据所述第一节点的决策条件对所述特征值进行判断,根据判断结果从所述第一节点的分支节点中确定遍历的第二节点;
[0032]根据当前决策维度索引和决策条件,继续提取实施预设第三方权威数据在所述第二节点的特征值并确定待遍历的下一节点,直至所述决策树遍历完成,得到所述预设第三方权威数据的各个种类,根据各个种类对所述预设第三方权威数据进行分类,得到分类数据。
[0033]可选地,所述利用预设第二鉴别模型检测所述分类数据来源可靠性,得到第三方数据可靠性检测结果,包括:
[0034]获取所述分类数据对应的数据来源地址,利用预设第二鉴别模型检测数据来源地址的准确性,得到数据来源检测结果;
[0035]当所述数据来源检测结果为合格时,利用所述第二鉴别模型检测所述分类数据进行合规性检测,得到合规性检测结果;
[0036]综合所述数据来源检测结果及所述合规性检测结果,得到第三方数据可靠性检测结果。
[0037]可选地,所述识别不合格初筛数据段的所属目标单位,重新采集目标单位原始数据,包括:
[0038]根据预设规则识别所述所属目标单位的单位安全等级;
[0039]识别所述不合格初筛数据段对应所述所属目标单位的数据安全等级及数据权重;
[0040]查询所述所属目标单位的所有业务数据的数据总量及所述不合格初筛数据段在对应所属目标单位中的数据容量;
[0041]计算所述不合格初筛数据段对所述所属目标单位的影响度;
[0042]当所述影响度不大于预设影响度阈值时,舍弃所述不合格初筛数据段;
[0043]当所述影响度大于预设影响度阈值时,重新采集目标单位的业务数据,并覆盖所述不合格初筛数据段对应的目标单位原始数据。
[0044]为了解决上述问题,本专利技术还提供一种基于大数据的数据安全管控装置,所述装置包括:
[0045]数据融合模块,用于获取目标单位原始数据及预设第三方权威数据;对所述目标单位原始数据进行压缩及分段处理,并筛选分段后数据,得到目标数据,对所述目标数据进行特征融合,得到融合数据,并将所述融合数据转换为预设格式存储至预设数据库;
[0046]数据分类模块,用于识别所述预设第三方权威数据的业务类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的数据安全管控方法,其特征在于,所述方法包括:获取目标单位原始数据及预设第三方权威数据;对所述目标单位原始数据进行压缩及分段处理,并筛选分段后数据,得到目标数据,对所述目标数据进行特征融合,得到融合数据,并将所述融合数据转换为预设格式存储至预设数据库;识别所述预设第三方权威数据的业务类别,根据所述业务类别选择预设分类模型对所述预设第三方权威数据进行分类,得到分类数据;利用预设第一鉴别模型,对所述融合数据进行规范性检查及安全审计操作,得到初步检测结果;利用预设第二鉴别模型检测所述分类数据来源可靠性,得到第三方数据可靠性检测结果;当所述初步检测结果及所述第三方数据可靠性检测结果均为合格时,根据所述分类数据,利用预设第三鉴别模型检测所述融合数据的安全性,得到安全数据及异常数据,按照标准管控方式管控所述安全数据,按照集中管控方式管控所述异常数据。2.如权利要求1所述的基于大数据的数据安全管控方法,其特征在于,所述对所述目标单位原始数据进行压缩及分段处理,并筛选分段后数据,得到目标数据,包括:对所述目标单位原始数据进行压缩,得到压缩数据;将所述压缩数据分段为多个目标待筛选数据段;计算各个目标待筛选数据段的准确率,根据所述准确率对所述多个目标待筛选数据段进行初步筛选,得到初筛数据段;根据所述准确率计算所述初筛数据段的校验值;根据所述校验值及预设校验阈值,判断所述初筛数据段是否合格;当所述初筛数据段不合格时,识别不合格初筛数据段的所属目标单位,重新采集目标单位原始数据,并返回所述对所述目标单位原始数据进行压缩,得到压缩数据的步骤,直至所述初筛数据段合格;当所述初筛数据段合格时,将合格的初筛数据段作为目标数据。3.如权利要求2所述的基于大数据的数据安全管控方法,其特征在于,所述根据所述准确率计算所述初筛数据段的校验值,包括:提取所述初筛数据段及所述目标待筛选数据段的平均特征值;统计所述初筛数据段及所述目标待筛选数据段的数据总量;根据所述初筛数据段的平均特征值、所述目标待筛选数据段的平均特征值、所述目标待筛选数据段的数据总量、所述初筛数据段的数据总量及所述初筛数据段的准确率,计算所述初筛数据段的校验值。4.如权利要求1所述的基于大数据的数据安全管控方法,其特征在于,所述对所述目标数据进行特征融合,得到融合数据,包括:利用预构建特征关系标识模型对所述目标数据进行特征关系标识,得到所述目标数据的数据特征;对所述数据特征进行数据结构化处理,得到结构化数据组;计算所述结构化数据组中数据之间的相似度;
将所述相似度值大于预设相似度阈值的数据进行融合操作,得到融合数据。5.如权利要求1所述的基于大数据的数据安全管控方法,其特征在于,所述根据所述业务类别选择预设分类模型对所述预设第三方权威数据进行分类,得到分类数据,包括:获取所述预设分类模型中的多个决策树及每个决策树中至少一层节点的决策维度索引和决策条件;根据所述预设分类模型中第一节点的决策维度索引,对所述预设第三方权威数据进行特征提取,得到所述预设第三方权威数据在所述第一节点的分裂维度上的特征值;根据所述第一节点的决策条件对所述特征值进行判断,...

【专利技术属性】
技术研发人员:刘存玉
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1