【技术实现步骤摘要】
图像敏感信息检测的方法、装置、计算机设备和存储介质
本专利技术涉及图像检测
,特别是涉及图像敏感信息检测的方法、图像敏感信息检测的装置、计算机设备和计算机可读存储介质。
技术介绍
随着网络监控技术的不断发展,网络上的隐私保护问题已经日益关注的问题。隐私数据的类型多种多样,包括结构化,半结构,非结构化数据,其中以半结构化和非结构化数据最为棘手。以非结构化隐私数据为例,其承载主体的形式包括:文本、图像、视频等。针对图像中隐私数据检测,相关技术提出,将图像输入深度学习模型,该深度学习模型能够识别文字,由此来检测图像中的敏感信息。然而,在实现本专利技术的过程中,专利技术人发现现有技术中存在如下问题:敏感信息数据量的大小和承载主体,都会影响敏感信息检测结果的精度,对于承载主体为图像的敏感信息数据,图像的尺寸、图像中文字的位置、文字的大小等,都对敏感信息保护的方法提出挑战,因此现有的图像敏感信息检测方法中,深度学习模型的复杂度非常高,检测效率较低,并且对于不同情况的图像,检测精度也不够理想。
技术实现思路
基于此,有必要针对现有方式图像敏感信息检测方法的效率及精度不够理想的问题,提供一种图像敏感信息检测的方法、装置、计算机设备和存储介质。一方面,本专利技术实施例提供一种图像敏感信息检测方法,包括:将待检测图像输入经过训练的第一神经网络;所述第一神经网络用于识别所述待检测图像中潜在的字符区域;所述潜在的字符区域包括独立的字符区域,和/或,叠加在背景图之上的字符信息;根据所述 ...
【技术保护点】
1.一种图像敏感信息检测方法,其特征在于,包括:/n将待检测图像输入经过训练的第一神经网络;所述第一神经网络用于识别所述待检测图像中潜在的字符区域;所述潜在的字符区域包括独立的字符区域,和/或,叠加在背景图之上的字符信息;/n根据所述第一神经网络的识别结果,从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图;/n将所述字符区域特征图输入经过训练的第二神经网络;第二神经网络用于识别所述字符区域特征图中的字符;/n根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息。/n
【技术特征摘要】
1.一种图像敏感信息检测方法,其特征在于,包括:
将待检测图像输入经过训练的第一神经网络;所述第一神经网络用于识别所述待检测图像中潜在的字符区域;所述潜在的字符区域包括独立的字符区域,和/或,叠加在背景图之上的字符信息;
根据所述第一神经网络的识别结果,从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图;
将所述字符区域特征图输入经过训练的第二神经网络;第二神经网络用于识别所述字符区域特征图中的字符;
根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息。
2.根据权利要求1所述的方法,其特征在于,所述第一神经网络对输入的待检测图像的处理包括:
基于轻量级的卷积神经网络,利用1×1的卷积核,将上层特征图的维度降低到1维;
对降维后的特征图分别对横轴和纵轴加和,计算响应值;采用预设阈值确定出高响应值区域和谷值区域,高响应值区域对应于潜在的字符区域,谷值区域对应于背景区域。
3.根据权利要求1所述的方法,其特征在于,所述从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图,包括:
从所述待检测图像中提取出所述潜在的字符区域,得到原始字符区域特征图;
对所述原始字符区域特征图进行缩放,以适应所述第二神经网络,得到所述字符区域特征图。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息,包括:
根据所述第二神经网络的识别结果,得到所述待检测图像中的字符信息;
将所述字符信息与设定信息比对,确定所述字符信息中是否包含敏感信息。
5.根据权利要求4所述的方法,其特征在于,还包括:
若所述待检测图像中包含敏感信息,对所述待检测图像中的目标区域进行处理以保护所述敏感信息;所述目标区域根据所述敏感信息所述待检测图像中的位置确定。
6.根据权利要求5所述的方法,其特征在于,所述对所述待检测图像中的目标区域进行处理以保护所述敏感信息,包括:
对所述待检测图像中的目标区域进行打码、擦除、模糊、覆盖中至少一种处理。
7.根据权利要求5所述的方法,其特征在于,还包括确定所述目标区域在所述待检测图像中的位置的步骤,包括:
计算所述字符区域特征图中选定点在所述待检测图像中的第一位置坐标;所述第一位置坐标根据所述选定点在所述字符区域特征图中的位置、位置映射关系以及所述选定点在所述原始字符区域特征图中的位置共同确定;所述位置映射关系为所述字符区域特征图中点的位置相对于所述原始字符区域特征图中对应点的位置的映射关系;
计算单个字符的长度;所述单个字符为从所述字符区域特征图中识别出的字符序列中的字符,所述单个字符的长度根据所述原始字符区域特征图的长度以及所述字符序列的字符长度得到;
获取所述敏感信息在所述字符序列中的偏移量和字符长度;
计算所述敏感信息在所述待检测图...
【专利技术属性】
技术研发人员:陈剑飞,陈俊臣,李飞鹏,钟世敏,李俊桃,张丽萍,
申请(专利权)人:数字广东网络建设有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。