图像敏感信息检测的方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:22974982 阅读:18 留言:0更新日期:2019-12-31 23:31
本发明专利技术涉及图像敏感信息检测的方法、装置、计算机设备和存储介质,应用于图像检测技术领域。所述方法包括:将待检测图像输入经过训练的第一神经网络;所述第一神经网络用于识别所述待检测图像中潜在的字符区域;根据所述第一神经网络的识别结果,从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图;将所述字符区域特征图输入经过训练的第二神经网络;第二神经网络用于识别所述字符区域特征图中的字符;根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息。本发明专利技术有利于提高检测效率,也有利于提高图像中敏感信息的检测精度。

Method, device, computer equipment and storage medium of image sensitive information detection

【技术实现步骤摘要】
图像敏感信息检测的方法、装置、计算机设备和存储介质
本专利技术涉及图像检测
,特别是涉及图像敏感信息检测的方法、图像敏感信息检测的装置、计算机设备和计算机可读存储介质。
技术介绍
随着网络监控技术的不断发展,网络上的隐私保护问题已经日益关注的问题。隐私数据的类型多种多样,包括结构化,半结构,非结构化数据,其中以半结构化和非结构化数据最为棘手。以非结构化隐私数据为例,其承载主体的形式包括:文本、图像、视频等。针对图像中隐私数据检测,相关技术提出,将图像输入深度学习模型,该深度学习模型能够识别文字,由此来检测图像中的敏感信息。然而,在实现本专利技术的过程中,专利技术人发现现有技术中存在如下问题:敏感信息数据量的大小和承载主体,都会影响敏感信息检测结果的精度,对于承载主体为图像的敏感信息数据,图像的尺寸、图像中文字的位置、文字的大小等,都对敏感信息保护的方法提出挑战,因此现有的图像敏感信息检测方法中,深度学习模型的复杂度非常高,检测效率较低,并且对于不同情况的图像,检测精度也不够理想。
技术实现思路
基于此,有必要针对现有方式图像敏感信息检测方法的效率及精度不够理想的问题,提供一种图像敏感信息检测的方法、装置、计算机设备和存储介质。一方面,本专利技术实施例提供一种图像敏感信息检测方法,包括:将待检测图像输入经过训练的第一神经网络;所述第一神经网络用于识别所述待检测图像中潜在的字符区域;所述潜在的字符区域包括独立的字符区域,和/或,叠加在背景图之上的字符信息;根据所述第一神经网络的识别结果,从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图;将所述字符区域特征图输入经过训练的第二神经网络;第二神经网络用于识别所述字符区域特征图中的字符;根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息。在其中一个实施例中,所述第一神经网络对输入的待检测图像的处理包括:基于轻量级的卷积神经网络,利用1×1的卷积核,将上层特征图的维度降低到1维;对降维后的特征图分别对横轴和纵轴加和,计算响应值;采用预设阈值确定出高响应值区域和谷值区域,高响应值区域对应于潜在的字符区域,谷值区域对应于背景区域。在其中一个实施例中,所述检测所述待检测图像中是否包含敏感信息之后,还包括:若所述待检测图像中包含敏感信息,对所述待检测图像中的目标区域进行处理以保护所述敏感信息;所述目标区域根据所述敏感信息所述待检测图像中的位置确定。在其中一个实施例中,所述从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图,包括:从所述待检测图像中提取出所述潜在的字符区域,得到原始字符区域特征图;对所述原始字符区域特征图进行缩放,以适应所述第二神经网络,得到所述字符区域特征图。在其中一个实施例中,还包括:将所述图像中的字符信息与设定信息比对,确定所述字符信息中是否包含敏感信息;和/或,所述对所述待检测图像中的目标区域进行处理以保护所述敏感信息,包括:对所述待检测图像中的目标区域进行打码、擦除、模糊、覆盖中至少一种处理。在其中一个实施例中,还包括确定所述目标区域在所述待检测图像中的位置的步骤,包括:计算所述字符区域特征图中选定点在所述待检测图像中的第一位置坐标;所述第一位置坐标根据所述选定点在所述字符区域特征图中的位置、位置映射关系以及所述选定点在所述原始字符区域特征图中的位置共同确定;所述位置映射关系为所述字符区域特征图中点的位置相对于所述原始字符区域特征图中对应点的位置的映射关系;计算单个字符的长度;所述单个字符为从所述字符区域特征图中识别出的字符序列中的字符,所述单个字符的长度根据所述原始字符区域特征图的长度以及所述字符序列的字符长度得到;获取所述敏感信息在所述字符序列中的偏移量和字符长度;计算所述敏感信息在所述待检测图像中的起始位置;所述起始位置根据所述第一位置、所述单个字符的长度以及所述偏移量确定;计算所述敏感信息在所述待检测图像中的覆盖长度和覆盖宽度;所述覆盖长度根据所述单个字符的长度以及所述字符长度得到,所述覆盖宽度根据所述原始字符区域特征图的宽度得到;根据所述起始位置、所述覆盖长度和覆盖宽度,得到所述目标区域在所述待检测图像中的位置。在其中一个实施例中,所述第一神经网络基于ResNet-22结构,所述第一神经网络包括依次布局的第一卷积层、第二卷积层和第三卷积层;所述第二卷积层中包括池化单元和至少两个第一bottleneck结构;第三卷积层中包括至少两个第二bottleneck结构;所述第一bottleneck结构和第二bottleneck结构,均设置为可分离卷积和分组卷积组合的结构。在其中一个实施例中,各个bottleneck结构包括:依次连接的第一卷积模块、第二卷积模块、第三卷积模块和加和模块,所述第一卷积模块的输入连接所述bottleneck结构的输入,所述bottleneck结构的输入、所述第三卷积模块的输出分别连接所述加和模块的输入,所述加和模块的输出连接所述bottleneck结构的输出;所述加和模块用于对输入该模块的特征图,在横轴维度上对所有像素点求和,以及在纵轴维度上对所有像素点求和;所述第一卷积模块、第二卷积模块、第三卷积模块中均包括卷积单元和归一化单元;第一卷积模块中的卷积单元和第三卷积模块中的卷积单元,均为分组卷积单元、且卷积核的大小均为1*1;第二卷积模块中的卷积单元为可分离卷积单元。在其中一个实施例中,所述第二神经网络为基于LSTM神经单元的循环神经网络,所述第二神经网络中包含至少两个LSTM神经单元。另一方面,本专利技术实施例提供一种图像敏感信息检测装置,包括:图像预处理模块,用于将待检测图像输入经过训练的第一神经网络;所述第一神经网络用于识别所述待检测图像中潜在的字符区域;所述潜在的字符区域包括独立的字符区域,和/或,叠加在背景图之上的字符信息;区域检测模块,用于根据所述第一神经网络的识别结果,从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图;字符检测模块,用于将所述字符区域特征图输入经过训练的第二神经网络;第二神经网络用于识别所述字符区域特征图中的字符;敏感信息检测模块,用于根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息。再一方面,本专利技术实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述任一实施例所述的图像敏感信息检测的方法。再一方面,本专利技术实施例提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一实施例所述的图像敏感信息检测的方法。上述技术方案中的一个技术方案具有如下优点或有益效果:对于待检测图像。首先将其输入经过训练的第一神经网络,通过所述第一神经网络对所述待检测图像进行降维,识别所述待检测图像中潜在的字符区域,所述本文档来自技高网...

【技术保护点】
1.一种图像敏感信息检测方法,其特征在于,包括:/n将待检测图像输入经过训练的第一神经网络;所述第一神经网络用于识别所述待检测图像中潜在的字符区域;所述潜在的字符区域包括独立的字符区域,和/或,叠加在背景图之上的字符信息;/n根据所述第一神经网络的识别结果,从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图;/n将所述字符区域特征图输入经过训练的第二神经网络;第二神经网络用于识别所述字符区域特征图中的字符;/n根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息。/n

【技术特征摘要】
1.一种图像敏感信息检测方法,其特征在于,包括:
将待检测图像输入经过训练的第一神经网络;所述第一神经网络用于识别所述待检测图像中潜在的字符区域;所述潜在的字符区域包括独立的字符区域,和/或,叠加在背景图之上的字符信息;
根据所述第一神经网络的识别结果,从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图;
将所述字符区域特征图输入经过训练的第二神经网络;第二神经网络用于识别所述字符区域特征图中的字符;
根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息。


2.根据权利要求1所述的方法,其特征在于,所述第一神经网络对输入的待检测图像的处理包括:
基于轻量级的卷积神经网络,利用1×1的卷积核,将上层特征图的维度降低到1维;
对降维后的特征图分别对横轴和纵轴加和,计算响应值;采用预设阈值确定出高响应值区域和谷值区域,高响应值区域对应于潜在的字符区域,谷值区域对应于背景区域。


3.根据权利要求1所述的方法,其特征在于,所述从所述待检测图像中提取出所述潜在的字符区域,得到字符区域特征图,包括:
从所述待检测图像中提取出所述潜在的字符区域,得到原始字符区域特征图;
对所述原始字符区域特征图进行缩放,以适应所述第二神经网络,得到所述字符区域特征图。


4.根据权利要求1所述的方法,其特征在于,所述根据所述第二神经网络的识别结果,检测所述待检测图像中是否包含敏感信息,包括:
根据所述第二神经网络的识别结果,得到所述待检测图像中的字符信息;
将所述字符信息与设定信息比对,确定所述字符信息中是否包含敏感信息。


5.根据权利要求4所述的方法,其特征在于,还包括:
若所述待检测图像中包含敏感信息,对所述待检测图像中的目标区域进行处理以保护所述敏感信息;所述目标区域根据所述敏感信息所述待检测图像中的位置确定。


6.根据权利要求5所述的方法,其特征在于,所述对所述待检测图像中的目标区域进行处理以保护所述敏感信息,包括:
对所述待检测图像中的目标区域进行打码、擦除、模糊、覆盖中至少一种处理。


7.根据权利要求5所述的方法,其特征在于,还包括确定所述目标区域在所述待检测图像中的位置的步骤,包括:
计算所述字符区域特征图中选定点在所述待检测图像中的第一位置坐标;所述第一位置坐标根据所述选定点在所述字符区域特征图中的位置、位置映射关系以及所述选定点在所述原始字符区域特征图中的位置共同确定;所述位置映射关系为所述字符区域特征图中点的位置相对于所述原始字符区域特征图中对应点的位置的映射关系;
计算单个字符的长度;所述单个字符为从所述字符区域特征图中识别出的字符序列中的字符,所述单个字符的长度根据所述原始字符区域特征图的长度以及所述字符序列的字符长度得到;
获取所述敏感信息在所述字符序列中的偏移量和字符长度;
计算所述敏感信息在所述待检测图...

【专利技术属性】
技术研发人员:陈剑飞陈俊臣李飞鹏钟世敏李俊桃张丽萍
申请(专利权)人:数字广东网络建设有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1