敏感数据检测方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:25949462 阅读:11 留言:0更新日期:2020-10-17 03:41
本申请实施例属于信息安全技术领域,涉及一种敏感数据检测方法,包括在接收到下发数据时,获取下发数据的数据类型,根据数据类型确定下发数据是否为文本数据;在确定下发数据为文本数据时,检测文本数据的文本类型,获取文本数据对应的特征码;将特征码与数据库中存储的标准特征码进行匹配,确定文本数据中是否存在敏感信息;在确定文本数据中存在敏感信息时,计算文本数据的基敏感度,对基敏感度不小于预设阈值的文本数据进行脱敏处理。本申请还提供一种敏感数据检测装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,下发数据可存储于区块链节点中。本申请提高了隐私数据的识别效率和精确率,保护个人信息的安全。

【技术实现步骤摘要】
敏感数据检测方法、装置、计算机设备及存储介质
本申请涉及信息安全
,尤其涉及一种敏感数据检测方法、装置、计算机设备及存储介质。
技术介绍
随着信息技术行业的快速发展,使用手机、计算机等电子设备进行办公或日常信息处理已成为人们生活中不可或缺的一部分,越来越多的人开始通过电子设备进行信息交流。然而,在信息技术带来便利的同时,信息泄露的问题越来越严重,信息安全问题也被越来越多人的人重视。在互联网应用中,很多信息都包括相对敏感的信息,这些信息直接在网络中进行传输,则会很容易造成用户隐私泄露的问题。当前,为避免用户隐私数据的泄露,保护用户信息安全,减少用户被骚扰甚至欺诈的可能,通常在接收到用户信息数据时,依靠人工进行用户信息数据的判断,在人为地筛选出可能的隐私数据时,再对数据进行加密处理等。然而,在同时接收到大量的用户信息数据时,当前的数据处理方式并不能实现对隐私数据快速检测筛选,由此导致对隐私数据不能进行及时地预警,进一步导致隐私数据泄露的问题。
技术实现思路
本申请实施例的目的在于提出一种敏感数据检测方法、装置、计算机设备及存储介质,旨在解决隐私数据泄露的技术问题。为了解决上述技术问题,本申请实施例提供一种敏感数据检测方法,采用了如下所述的技术方案:一种敏感数据检测方法,包括以下步骤:在接收到下发数据时,获取所述下发数据的数据类型,根据所述数据类型确定所述下发数据是否为文本数据;在确定所述下发数据为所述文本数据时,检测所述文本数据的文本类型,根据所述文本类型确定所述文本数据对应的特征码;将所述特征码与数据库中存储的标准特征码进行匹配,确定所述文本数据中是否存在敏感信息;在确定所述文本数据中存在所述敏感信息时,计算所述文本数据的基敏感度,对所述基敏感度不小于预设阈值的文本数据进行脱敏处理。进一步的,所述计算所述文本数据的基敏感度的步骤包括:获取所述文本数据的基准分数;根据所述基准分数确定所述文本数据的基敏感度。进一步的,所述根据所述基准分数确定所述文本数据的基敏感度的步骤包括:从所述数据库中获取预设的标记隐私数据,计算所述文本数据与所述标记隐私数据的匹配度;根据所述匹配度和所述基准分数,计算所述文本数据的基敏感度。进一步的,所述根据所述文本类型确定所述文本数据对应的特征码的步骤包括:所述文本类型包括数字类型、字母类型及文字类型,按照所述文本类型对所述文本数据进行对应的符号化处理,得到符号化处理后的文本数据为所述文本数据对应的特征码。进一步的,所述将所述特征码与数据库中存储的标准特征码进行匹配,确定所述文本数据中是否存在敏感信息的步骤包括:通过语法分析识别所述特征码中的关键词,根据数据库中存储的标准特征码构建的文档链表,获取包括所述关键词的文档;获取所述文档与所述特征码之间的相关性,根据所述相关性确定所述文本数据中是否存在敏感信息。进一步的,所述确定所述文本数据中是否存在敏感信息的步骤之后,所述敏感数据检测方法还包括:在确定所述文本数据中存在所述敏感信息时,发送所述下发数据至前端页面,检测所述下发数据是否被所述前端页面完全使用,若所述前端页面中存在未使用数据,则确定所述下发数据提供过量,发送报警提示信息。进一步的,所述根据所述数据类型确定所述下发数据是否为文本数据的步骤之后,所述敏感数据检测还包括:在确定所述下发数据为非文本数据时,根据所述数据类型确定所述下发数据是否为图像数据;在确定所述下发数据为所述图像数据时,提取所述图像数据中的图像信息及信息提供方的使用权限,根据所述图像信息和所述使用权限确定所述图像数据中是否包括敏感信息,若所述图像数据中包括所述敏感信息,则标记存储所述图像数据;在确定所述下发数据为音频数据或视频数据时,识别所述音频数据或所述视频数据中的语音数据,确定所述语音数据中是否包括敏感信息,若所述语音数据中包括所述敏感信息,则标记存储所述音频数据或所述视频数据。为了解决上述技术问题,本申请实施例还提供一种敏感数据检测装置,采用了如下所述的技术方案:第一确认模块,用于在接收到下发数据时,获取所述下发数据的数据类型,根据所述数据类型确定所述下发数据是否为文本数据;获取模块,用于在确定所述下发数据为所述文本数据时,检测所述文本数据的文本类型,根据所述文本类型确定所述文本数据对应的特征码;第二确认模块,用于将所述特征码与数据库中存储的标准特征码进行匹配,确定所述文本数据中是否存在敏感信息;脱敏模块,用于在确定所述文本数据中存在所述敏感信息时,计算所述文本数据的基敏感度,对所述基敏感度不小于预设阈值的文本数据进行脱敏处理。为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述敏感数据检测方法的步骤。为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述敏感数据检测方法的步骤。上述敏感数据检测方法、装置、计算机设备及存储介质,通过在接收到下发数据时,获取所述下发数据的数据类型,根据所述数据类型确定所述下发数据是否为文本数据,以便根据数据类型对不同的数据进行处理;在确定所述下发数据为所述文本数据时,检测所述文本数据的文本类型,根据所述文本类型确定所述文本数据对应的特征码,其中,特征码用来表示该文本数据的特征信息,不同文本类型的文本数据对应不同类型的特征码;将所述特征码与数据库中存储的标准特征码进行匹配,确定所述文本数据中是否存在敏感信息,在确定所述文本数据中存在敏感信息时,计算所述文本数据的基敏感度,该基敏感度可以用来衡量该文本数据的敏感程度,在获取到该基敏感度时,则对所述基敏感度不小于预设阈值的文本数据进行脱敏处理,由此则解决了隐私数据泄露的技术问题。附图说明为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请可以应用于其中的示例性系统架构图;图2为敏感数据检测方法的一个实施例的流程图;图3是根据本申请的敏感数据检测装置的一个实施例的结构示意图;图4是根据本申请的计算机设备的一个实施例的结构示意图。附图标记:600敏感数据检测装置;610第一确认模块;620获取模块;630第二确认模块;640脱敏模块。具体实施方式除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,本文档来自技高网
...

【技术保护点】
1.一种敏感数据检测方法,其特征在于,包括下述步骤:/n在接收到下发数据时,获取所述下发数据的数据类型,根据所述数据类型确定所述下发数据是否为文本数据;/n在确定所述下发数据为所述文本数据时,检测所述文本数据的文本类型,根据所述文本类型确定所述文本数据对应的特征码;/n将所述特征码与数据库中存储的标准特征码进行匹配,确定所述文本数据中是否存在敏感信息;/n在确定所述文本数据中存在所述敏感信息时,计算所述文本数据的基敏感度,对所述基敏感度不小于预设阈值的文本数据进行脱敏处理。/n

【技术特征摘要】
1.一种敏感数据检测方法,其特征在于,包括下述步骤:
在接收到下发数据时,获取所述下发数据的数据类型,根据所述数据类型确定所述下发数据是否为文本数据;
在确定所述下发数据为所述文本数据时,检测所述文本数据的文本类型,根据所述文本类型确定所述文本数据对应的特征码;
将所述特征码与数据库中存储的标准特征码进行匹配,确定所述文本数据中是否存在敏感信息;
在确定所述文本数据中存在所述敏感信息时,计算所述文本数据的基敏感度,对所述基敏感度不小于预设阈值的文本数据进行脱敏处理。


2.根据权利要求1所述的敏感数据检测方法,其特征在于,所述计算所述文本数据的基敏感度的步骤包括:
获取所述文本数据的基准分数;
根据所述基准分数确定所述文本数据的基敏感度。


3.根据权利要求2所述的敏感数据检测方法,其特征在于,所述根据所述基准分数确定所述文本数据的基敏感度的步骤包括:
从所述数据库中获取预设的标记隐私数据,计算所述文本数据与所述标记隐私数据的匹配度;
根据所述匹配度和所述基准分数,计算所述文本数据的基敏感度。


4.根据权利要求1所述的敏感数据检测方法,其特征在于,所述根据所述文本类型确定所述文本数据对应的特征码的步骤包括:
所述文本类型包括数字类型、字母类型及文字类型,按照所述文本类型对所述文本数据进行对应的符号化处理,得到符号化处理后的文本数据为所述文本数据对应的特征码。


5.根据权利要求1所述的敏感数据检测方法,其特征在于,所述将所述特征码与数据库中存储的标准特征码进行匹配,确定所述文本数据中是否存在敏感信息的步骤包括:
通过语法分析识别所述特征码中的关键词,根据数据库中存储的标准特征码构建的文档链表,获取包括所述关键词的文档;
获取所述文档与所述特征码之间的相关性,根据所述相关性确定所述文本数据中是否存在敏感信息。


6.根据权利要求1所述的敏感数据检测方法,其特征在于,所述确定所述文本数据中是否存在敏感信息的步骤之后,所述敏感数据检测方法还包括:<...

【专利技术属性】
技术研发人员:朱欢敏
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1