基于元数据的资产分析方法及装置制造方法及图纸

技术编号:38996331 阅读:5 留言:0更新日期:2023-10-07 10:27
本发明专利技术提供的一种基于元数据的资产分析方法及装置,其方法包括:获取已完成隐私数据筛选的第一数据资产,将第一数据资产的所有第一元数据按照是否包含有隐私数据来进行打标,将打标后的所有第一元数据作为数据集;使用数据集训练一神经网络模型,以得到训练结果达到预期效果的数据资产识别模型;获取未完成隐私数据筛选的第二数据资产的第二元数据,将第二元数据输入到数据资产识别模型,以得到数据资产识别模型输出的是否包含有隐私数据的识别结果;对所有识别结果为包含有隐私数据的第二元数据所对应的数据资产进行隐私数据的数据匹配,以完成第二数据资产的隐私数据筛选。本发明专利技术能快速准确的实现数据资产的分析。发明专利技术能快速准确的实现数据资产的分析。发明专利技术能快速准确的实现数据资产的分析。

【技术实现步骤摘要】
基于元数据的资产分析方法及装置


[0001]本专利技术涉及语音分析
,特别涉及一种基于元数据的资产分析方法及装置。

技术介绍

[0002]数据资产是指由个人或企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源。而根据有关数据显示,目前企业已知的数据资产仅占资产总数的一半左右,剩余的部分,属于企业中未被发现与保护的不明资产,一般称为“暗资产”。
[0003]暗资产的发现与保护对于企业是至关重要的。其中,暗资产的数据中若包含有隐私数据,但没有进行及时的发现和管理,则存在隐私数据泄露问题。比如某个开放接口的共享数据是包含了用户的电话号码,如果没有进行备案监管就直接开放共享则会造成个人信息的泄露。
[0004]由此可见,对于暗资产的识别和发现是至关重要的,但现有技术缺乏一种快速准确的资产分析方法。

技术实现思路

[0005]为了解决现有技术的上述问题,本专利技术提供一种基于元数据的资产分析方法及装置,以快速准确的实现资产分析。
[0006]为了达到上述目的,本专利技术采用的技术方案为:
[0007]第一方面,本专利技术提供一种基于元数据的资产分析方法,包括步骤:
[0008]S1、获取已完成隐私数据筛选的第一数据资产,将所述第一数据资产的所有第一元数据按照是否包含有隐私数据来进行打标,将打标后的所有第一元数据作为数据集;
[0009]S2、使用所述数据集训练一神经网络模型,以得到训练结果达到预期效果的数据资产识别模型;/>[0010]S3、获取未完成隐私数据筛选的第二数据资产的第二元数据,将所述第二元数据输入到所述数据资产识别模型,以得到所述数据资产识别模型输出的是否包含有隐私数据的识别结果;
[0011]S4、对所有识别结果为包含有隐私数据的第二元数据所对应的数据资产进行隐私数据的数据匹配,以完成所述第二数据资产的隐私数据筛选。
[0012]本专利技术的有益效果在于:在对数据资产进行隐私数据的数据匹配时,通过神经网络模型对是否包含有隐私数据的数据资产的元数据进行训练,之后将需要分析的数据资产的元数据输入到已经训练好的数据资产识别模型来进行区分,再根据数据匹配进行最终的隐私数据筛选。由于元数据本身就是描述数据的数据,因此,采用数据资产的元数据作为判断标准,能够保证数据资产的分析准确性,而使用神经网络模型对所有需要分析的数据资产先进行筛选,从而能够减少需要数据匹配的数据资产,以提高数据资产的分析速度,即本
专利技术能快速准确的实现数据资产的分析。
[0013]可选地,所述步骤S3中获取未完成隐私数据筛选的第二数据资产的第二元数包括:
[0014]获取未完成隐私数据筛选的第二数据资产;
[0015]获取所述数据资产识别模型的识别准确率和所述数据匹配的匹配准确率,判断所述识别准确率是否大于所述匹配准确率或者所述第二数据资产的数据量是否大于预设数据量阈值,若是,则获取所述第二数据资产的第二元数据,否则直接对所述第二数据资产进行隐私数据的数据匹配。
[0016]根据上述描述可知,通过对分析速度和分析准确率进行综合判断,以采用速度和准确率综合起来更佳的处理方式来进行数据资产的隐私数据筛选,从而保证数据资产分析的快速准确性。
[0017]可选地,所述判断所述识别准确率是否大于所述匹配准确率或者所述第二数据资产的数据量是否大于预设数据量阈值替换为:
[0018]根据所述第二数据资产的数据量分别得到所述数据资产识别模型的识别用时和所述数据匹配的匹配用时,按照预设的权重系数对所述识别准确率和所述识别用时进行换算得到所述数据资产识别模型的最终识别数值,按照预设的权重系数对所述匹配准确率和所述匹配用时进行换算得到所述数据匹配的最终匹配数值,判断所述最终识别数值是否大于所述最终匹配数值。
[0019]根据上述描述可知,通过对分析速度和分析准确率进行综合判断,以采用速度和准确率综合起来更佳的处理方式来进行数据资产的隐私数据筛选,从而保证数据资产分析的快速准确性。
[0020]可选地,所述步骤S4之后还包括步骤:
[0021]根据所述第二数据资产的隐私数据筛选结果对所述数据资产识别模型进行更新优化。
[0022]根据上述描述可知,通过后续的每一次识别结果对数据资产识别模型进行更新优化,以不断提高数据资产识别模型的识别准确率。
[0023]可选地,所述数据匹配为采用正规表达式进行匹配。
[0024]可选地,所述步骤S4之后还包括步骤:
[0025]获取隐私数据资产,所述隐私数据资产为所述第二数据资产中包含有隐私数据的所有数据资产;
[0026]判断所述隐私数据资产中每一个数据资产的第二元数据中是否包含有数据接口,若有,则将所包含的数据接口放入到需要安全备案的隐私数据接口集合中;
[0027]否则获取所述隐私数据资产中不包含有数据接口的其余数据资产,获取所述其余数据资产中每一个数据资产的数据参数,并从当前已知的每一个数据接口的接口日志中获取其接口状态;
[0028]将每一个数据资产的数据参数分别和每一个数据接口的接口状态进行匹配,将匹配程度最高且超过第一阈值的数据接口放入到隐私数据接口集合中;
[0029]输出并显示所述隐私数据接口集合。
[0030]根据上述描述可知,通过已经识别出来的包含有隐私数据的数据资产的元数据来
获取这些隐私数据的来源;而在元数据中没有记录来源的数据接口时,获取其数据参数和所有已知的数据接口的接口状态来进行匹配,通过最终的匹配关系确定其来源的数据接口,从而能快速准确的识别出来需要安全管控的数据接口,避免隐私数据在没有监控的情况下所发生的泄露情况。
[0031]可选地,还包括步骤:
[0032]若所述其余数据资产中的某一个数据资产不存在匹配程度超过第一阈值的数据接口,则生成疑似潜在接口的风险提示。
[0033]根据上述描述可知,当包含有隐私数据的数据资产没有和当前已知的数据接口存在匹配程度较高的情况,则有可能存在未被公司所识别到的数据接口,因此,生成疑似潜在接口的风险提示,便于公司进行潜在接口的排查。
[0034]可选地,还包括步骤:
[0035]在预设周期内,根据业务情况对当前已知的每一个数据接口进行接口状态的调整,并在调整后,实时监测数据资产的变化与接口状态的变化之间的关联程度,当所述关联程度小于第二阈值时,则生成疑似潜在接口的风险提示。
[0036]根据上述描述可知,通过对前已知的每一个数据接口进行接口状态的调整,由于接口状态的调整影响数据的接收和发送,因此,数据资产的变化随着接口状态的调整存在其关联性,而如果出现不关联的情况,则表明有未被公司所识别到的数据接口在进行数据窃取,因此,生成疑似潜在接口的风险提示,便于公司进行潜在接口的排查。
[0037]可选地,所述数据参数包括所述其余数据资产中每一个数据资产的数据生成时间戳和数据量。
[003本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于元数据的资产分析方法,其特征在于,包括步骤:S1、获取已完成隐私数据筛选的第一数据资产,将所述第一数据资产的所有第一元数据按照是否包含有隐私数据来进行打标,将打标后的所有第一元数据作为数据集;S2、使用所述数据集训练一神经网络模型,以得到训练结果达到预期效果的数据资产识别模型;S3、获取未完成隐私数据筛选的第二数据资产的第二元数据,将所述第二元数据输入到所述数据资产识别模型,以得到所述数据资产识别模型输出的是否包含有隐私数据的识别结果;S4、对所有识别结果为包含有隐私数据的第二元数据所对应的数据资产进行隐私数据的数据匹配,以完成所述第二数据资产的隐私数据筛选。2.根据权利要求1所述的基于元数据的资产分析方法,其特征在于,所述步骤S3中获取未完成隐私数据筛选的第二数据资产的第二元数包括:获取未完成隐私数据筛选的第二数据资产;获取所述数据资产识别模型的识别准确率和所述数据匹配的匹配准确率,判断所述识别准确率是否大于所述匹配准确率或者所述第二数据资产的数据量是否大于预设数据量阈值,若是,则获取所述第二数据资产的第二元数据,否则直接对所述第二数据资产进行隐私数据的数据匹配。3.根据权利要求2所述的基于元数据的资产分析方法,其特征在于,所述判断所述识别准确率是否大于所述匹配准确率或者所述第二数据资产的数据量是否大于预设数据量阈值替换为:根据所述第二数据资产的数据量分别得到所述数据资产识别模型的识别用时和所述数据匹配的匹配用时,按照预设的权重系数对所述识别准确率和所述识别用时进行换算得到所述数据资产识别模型的最终识别数值,按照预设的权重系数对所述匹配准确率和所述匹配用时进行换算得到所述数据匹配的最终匹配数值,判断所述最终识别数值是否大于所述最终匹配数值。4.根据权利要求1所述的基于元数据的资产分析方法,其特征在于,所述步骤S4之后还包括步骤:根据所述第二数据资产的隐私数据筛选...

【专利技术属性】
技术研发人员:王小军高翔廖秀聆赖孝友
申请(专利权)人:福建中信网安信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1