【技术实现步骤摘要】
一种保护敏感内容的方法、系统和存储介质
本申请涉及敏感内容的保护领域,尤其是防止网站上的敏感内容被非法盗取的方法、系统和存储介质。
技术介绍
用户和公司的敏感内容保护一直是数据安全领域重点关注的研究方向。在互联网技术还未普及的阶段,也即数据交流和传递还是利用物理存储介质(例如软盘、硬盘、U盘、光盘等等数据存储介质)来实现的时期,敏感数据的保护主要依赖于对数据或存储介质进行加密和解密来实现,即通过对敏感数据或存储介质应用一种加密算法/密钥并提供相应的解密算法/密钥来保证只有授权(拥有解密算法/密钥)的人才能看到敏感数据。但随着时代的发展,互联网技术开始普及到人们生活的方方面面,越来越多的数据开始依赖于网络传输,而非物理存储介质,在人与人之间进行传递。传统的数据加密/解密机制不再适用于基于互联网的数据安全保护。例如,发布加密敏感内容的公司无法保证拥有解密密钥的用户能够不做出将解密的敏感内容非法保存并分享给其他未经授权的用户的行为。而且,由于互联网的自由性、实时性、共享性和开放性等特点,一旦所述敏感内容在网络上被泄 ...
【技术保护点】
1.一种用于保护敏感内容的方法,包括:/n确定网页上要显示内容的位置;/n预加载所述内容并识别所述内容中的敏感信息;/n针对识别出的所述敏感信息,确定与所述敏感信息相似的干扰内容;/n基于所述干扰内容构建干扰图;/n根据所确定的位置,将所述干扰图加载到该位置处作为背景;/n在所确定的位置处显示所述内容。/n
【技术特征摘要】
1.一种用于保护敏感内容的方法,包括:
确定网页上要显示内容的位置;
预加载所述内容并识别所述内容中的敏感信息;
针对识别出的所述敏感信息,确定与所述敏感信息相似的干扰内容;
基于所述干扰内容构建干扰图;
根据所确定的位置,将所述干扰图加载到该位置处作为背景;
在所确定的位置处显示所述内容。
2.如权利要求1所述的方法,其特征在于,其中所述确定与所述敏感信息相似的干扰内容是通过计算所述敏感信息中的每个敏感字符与样本字符库中的各字符样本之间的相似度值是否超过阈值来实现的。
3.如权利要求2所述的方法,其特征在于,其中所述计算所述敏感信息中的每个敏感字符与所述字符样本之间的相似度值是利用如下的巴氏系数来计算:
BC(p,p’)=∑√p(x)p’(x)
其中,p,p’分别代表敏感字符与要进行匹配的字符样本的直方图数据,对所述直方图数据中每个相同数据点x处的敏感字符与字符样本的灰度值乘积开平方以后进行累加,最终得出这两个字符的图像的相似度值结果BC,所述BC的取值范围在(0,1)之间。
4.如权利要求3所述的方法,其特征在于,基于所述干扰内容构建干扰图包括:
将匹配的字符样本的灰度值设置为比所述敏感字符的灰度值低的灰度值,并生成对应的数组,随后将该数组填充到空白干扰图的相应位置处。
5.一种通过OCR识别将经干扰的内容的图片转换成文本的方法,包括:
将经干扰的内容的图片作为输入提供给OCR系统,其中所述经干扰的内容的图片包含如权利要求1所述的敏感信息和干扰图;
对所述图片中的像素点进行扫描;
根据所述像素点来识别出字符的边缘,所识别的字符的边缘还包含了所述干扰图中的干扰内容;
根据所述边缘对字符进行分类计算,所述分类计算基于识别的字符的复杂度消耗相应的内存;
其中,由于所识别的字符的边缘还包含了所述干扰图中的干扰内容,导致复杂度增加,进而使得所述分类计算...
【专利技术属性】
技术研发人员:郭亮,郑鸿咚,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。