【技术实现步骤摘要】
一种用于网页截图的脱敏、还原方法和系统
[0001]本专利技术涉及信息安全的
,尤其涉及一种用于网页截图的脱敏、还原方法和系统。
技术介绍
[0002]随着人脸检测识别、车辆检测识别、ocr识别等相关技术发展,在各种场景下应用也越来越广泛,在各种应用系统上展示也是越来越丰富的个人身份信息、手机信息、人脸信息、车辆信息等,同时,国家对个人隐私也是越来越重视,如何加强隐私保护,防范一些系统截图包含隐私信息流传问题亟需解决。
[0003]现如今各种应用系统展示和截图时无法支持自动隐藏人员姓名、身份证、手机、人脸图片、车辆图片、一些字典敏感文字信息,难免会造成截图泄露敏感信息;若对截图上的敏感文字信息进行人工脱敏,对于特定条件下需要对数据内容和数据来源信息进行还原则难以实现。
技术实现思路
[0004]为了解决现有技术中无法自动实现对网页截图的自动脱敏处理并在特定条件下的还原问题,本专利技术提出了一种用于网页截图的脱敏、还原方法和系统,用以解决上述技术问题。
[0005]根据本专利技术的第一方面 ...
【技术保护点】
【技术特征摘要】
1.一种用于网页截图的脱敏方法,其特征在于,包括:S1:递归遍历网页中所有元素,获取包括元素文本信息和坐标信息的文本信息集合;S2:利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对所述元素文本信息进行敏感信息匹配,获取敏感信息集合;S3:对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,并构建文本图片替换信息集合;S4:对所述原始图片进行人脸和车辆识别检测,分别得到包括人脸位置坐标的人脸信息集合和车牌位置坐标车辆信息集合,并分别对所述脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至所述替换信息集合中;S5:利用随机生成的密钥生成二维码图片替换所述初始脱敏图片的一边角像素,输出最终脱敏图片,并利用所述密钥对替换信息集合进行加密生成与所述脱敏图片对应的数据加密文件。2.根据权利要求1所述的用于网页截图的脱敏方法,其特征在于,所述步骤S3具体包括:根据所述敏感信息集合的坐标信息对所述原始图片将对应位置区域像素使用R、G、B值均为255的白值填充,生成中间图片;对所述中间图片进行OCR识别,获取包括文本信息和坐标信息的OCR识别集合;利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对所述OCR识别集合进行敏感信息匹配,并更新补充至所述敏感信息集合中。3.根据权利要求2所述的用于网页截图的脱敏方法,其特征在于,所述步骤S3中脱敏文本图片的获取具体包括以下步骤:根据所述敏感信息集合的坐标信息对所述原始图片进行遍历,获取集合中每一个对应坐标位置的像素区域,并提取所述像素区域的背景;利用与所述敏感信息集合的文本长度信息生成替代内容文本,所述替代内容文本将所述敏感信息集合的文本替换为其他文本标识;结合所述内容文本和所述背景填充至对应的敏感信息的像素区域内。4.根据权利要求1所述的用于网页截图的脱敏方法,其特征在于,所述步骤S5具体包括生成随机128位密钥,并将所述128位密钥生成100*100的二维码图片,利用所述二维码图片替换所述初始脱敏图片的的右下角像素,生成最终脱敏图片,并将被替换下的所述右下角像素内容加入所述替换信息集合中。5.根据权利要求1所述的用于网页截图的脱敏方法,其特征在于,还包括对所述最终脱敏图片进行SHA256提取图片摘要信息,利用所述密钥对所述替换信息集合、生成时间、客户端IP、MAC地址和所述图片摘要信息进行加密生成数据加密文件。6.一种用于网页截图的脱敏还原方法,包括输入如权利要求1
‑
5中任一项所述的脱敏方法中生成的所述最终脱敏图片和所述数据加密文件,其特征在于,还包括:识别...
【专利技术属性】
技术研发人员:陈生坚,范志建,李昌华,李仁杰,江文涛,
申请(专利权)人:罗普特厦门系统集成有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。