一种基于直方图二值化的纸质敏感文件溯源方法技术

技术编号：27368260 阅读：53 留言：0更新日期：2021-02-19 13:52

本发明专利技术提供一种基于直方图二值化的纸质敏感文件溯源方法，涉及信息识别技术领域，包括以下步骤：S1：获取敏感文档图片；S2：对获取的文档图片预处理，去除干扰区域；S3：对敏感区域进行灰度直方图增强；S4：对图像二值化；S5：解码二值化图像隐写信息；S6：隐写信息通过校验，则溯源出隐写信息；反之则未检测到隐写信息。本发明专利技术不易被泄密者发现，且无需对每种字体设计字形字库，使用的直方图二值化算法，能有效提高文档打印涉密的管控力度，集成到DLP系统中，能增强DLP系统对非确切文档的溯源、追踪能力，确保及时、有效的溯源机密文档外泄途径，降低企业和政府部门损失，且具有很好的抗压缩、抗斜拍、抗阴影、抗污损能力。抗污损能力。抗污损能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于直方图二值化的纸质敏感文件溯源方法

[0001]本专利技术涉及信息识别
，尤其是，本专利技术涉及一种基于直方图二值化的纸质敏感文件溯源方法。

技术介绍

[0002]数据是信息系统中最为核心的资产，随着信息技术的飞速发展，人类生产生活中产生的各类数据呈指数级增长，这些数据具有重要价值。因此数据安全领域已成为企业和国家的重点关注领域。目前许多企业和政府部门采用电子文档办公，并通过打印、拍照、复印等途径将文档内容呈现在纸介质上，以方便日常阅读和办公。对于敏感信息，如企业合同和政府部门涉密文件，由于纸介质难以追溯的特性，许多机密信息会通过纸质文档泄露出去，给企业和国家造成重大损失。
[0003]传统数据防泄漏（Data Leakage Prevention，DLP）领域大多对电子文档等确切数据进行有效的安全防护，无法对非确切数据（如打印、复印、拍照）进行有效的监控、拦截和追溯。因此需要对文档传播路径进行额外管控，防止机密信息通过文档外泄。
[0004]已有的纸质文档溯源方法分为两类：在纸介质上嵌入纹路、点阵、二维码等可见信息（明水印）；将溯源信息隐藏到自定义的字形字库中（字形字库水印），例如中国专利专利技术专利CN107239713A涉及一种敏感内容数据信息防护方法和系统。该方法包括：1)设计基因字库文件，包括字符和字符的安全编码，每个字符的安全编码与该字符在标准字库中的标准编码形成多对一的映射关系；2)将基因字库文件设置为禁止嵌入模式，并进行整体加密后保存在服务器上，不直接在客户端的操作系统中...

【技术保护点】

【技术特征摘要】
1.一种基于直方图二值化的纸质敏感文件溯源方法，其特征在于，包括以下步骤：S1：获取敏感文档图片；S2：对获取的文档图片预处理，去除干扰区域；S3：定位文档敏感区域，对敏感区域进行灰度直方图增强；S4：计算增强后的区域图像二值化阈值，对图像二值化；S5：解码二值化图像隐写信息；S6：判断隐写信息是否可以通过校验；若可以则溯源出隐写信息；反之则未检测到隐写信息。2.根据权利要求1所述的一种基于直方图二值化的纸质敏感文件溯源方法，其特征在于：执行步骤S1之前，需要在敏感文档中隐藏溯源信息。3.根据权利要求2所述的一种基于直方图二值化的纸质敏感文件溯源方法，其特征在于：在敏感文档中隐藏溯源信息具体包括：敏感文档打印时，系统实时hook打印请求，获取打印页大小，然后根据页面大小，自适应的将溯源信息隐藏到打印文件中。4.根据权利要求1所述的一种基于直方图二值化的纸质敏感文件溯源方法，其特征在于：执行步骤S1时，敏感文档图片包括打印件、复印件、扫描件和照片。5.根据权利要求1所述的一种基于直方图二值化的纸质敏感文件溯源方法，其特征在于，步骤S2具体包括：S...

【专利技术属性】
技术研发人员：张黎，杨大志，吴洋，李蓓蓓，
申请(专利权)人：合肥闪捷信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人