用于防止对象特定图像域中的数据丢失的结构化文本和图案匹配制造技术

技术编号：22225748 阅读：66 留言：0更新日期：2019-09-30 06:18

可以执行结构化文本和图案匹配以防止对象特定图像域中的数据丢失。根据一些实施方案，一种方法可以包括：接收图像；基于所述一个或多个对象的属性识别所述图像中的一个或多个对象；以及由计算设备确定所述一个或多个对象中的第一对象的对象类型。所述方法可以包括：由所述计算设备基于所述第一对象的所述对象类型识别所述第一对象的一个或多个特定区域以进行辨识；以及辨识在所述第一对象的所述一个或多个特定区域中的文本。在一些实施方案中，所述方法然后可以包括由所述计算设备将在所述第一对象的所述一个或多个特定区域中辨识出的所述文本提供给安全引擎，其中所述安全引擎可以被配置为评估所述文本是否包括敏感信息。

Structured text and pattern matching to prevent data loss in object-specific image domains

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于防止对象特定图像域中的数据丢失的结构化文本和图案匹配
本公开整体涉及计算机安全性，并且更具体地涉及自动地评估图像中的对象是否可能包含敏感信息。
技术介绍
专有和/或保密数据的泄漏对于组织机构诸如公司、政府和大学来说是一直存在的问题。组织机构的计算机的如今无所不在的远程网络访问提高了工作效率并且是方便的，但是同时也为保护数据免被未授权方(诸如竞争对手或犯罪分子)访问带来更大的挑战。企业数据的泄漏可能源于不道德的雇员的故意行为，以及没有遵循稳健安全程序的雇员的无意但疏忽的行为。组织机构缺乏对敏感文档和信息的访问和流通的可见性。管理员缺乏跟踪数据访问和使用的工具。跟踪企业数据的访问和流通并防止泄漏比以往更困难。然而，组织机构确切地想要根据企业级信息控制政策来限制保密数据的访问和使用。一些用于跟踪企业数据的访问和流通的技术将文本串与所限定的信息或信息类型的数据库进行比较。然而，这些技术不会扩展到其中信息包含在图像中的情况，诸如一张或多张银行支票、信用卡或驾驶执照的图像。常规的光学字符辨识(OCR)技术不能以足够快速、准确和/或有效的方式准确地确定图像的内容(包括图像是否包含敏感信息)来满足数据丢失防护(DLP)系统的要求。例如，一些常规的图像分析需要大量计算资源，从而导致不可接受的计算资源成本和延迟，尤其是对于企业应用程序来说。此外，常规的系统的捕获、处理和分析复杂图像的能力是有限的。这些问题需要得到解决。
技术实现思路
计算设备可以接收图像，并且可以基于一个或多个对象的属性识别图像中的一个或多个对象。可以由计算设备确定一个或多个对象中的第一对象的对象类型。还可以...

【技术保护点】
1.一种计算机实现的方法，包括：由计算设备接收图像；基于一个或多个对象的属性由所述计算设备识别所述图像中的一个或多个对象；由所述计算设备确定所述一个或多个对象中的第一对象的对象类型；基于所述第一对象的所述对象类型由所述计算设备识别所述第一对象的一个或多个特定区域以进行辨识；由所述计算设备辨识在所述第一对象的所述一个或多个特定区域中的文本；以及由所述计算设备将在所述第一对象的所述一个或多个特定区域中辨识出的所述文本提供给安全引擎，所述安全引擎被配置为评估所述文本是否包括敏感信息。

【技术特征摘要】
【国外来华专利技术】2017.01.30 US 15/4197561.一种计算机实现的方法，包括：由计算设备接收图像；基于一个或多个对象的属性由所述计算设备识别所述图像中的一个或多个对象；由所述计算设备确定所述一个或多个对象中的第一对象的对象类型；基于所述第一对象的所述对象类型由所述计算设备识别所述第一对象的一个或多个特定区域以进行辨识；由所述计算设备辨识在所述第一对象的所述一个或多个特定区域中的文本；以及由所述计算设备将在所述第一对象的所述一个或多个特定区域中辨识出的所述文本提供给安全引擎，所述安全引擎被配置为评估所述文本是否包括敏感信息。2.根据权利要求1所述的计算机实现的方法，还包括：响应于所述安全引擎确定所述第一对象的所述一个或多个特定区域中的所述文本不包括敏感信息，由所述计算设备将所述第一对象分类为不包括敏感信息。3.根据权利要求1所述的计算机实现的方法，还包括：由所述计算设备确定在所述第一对象的所述一个或多个特定区域中是否存在文本；以及响应于确定在所述一个或多个特定区域中不存在文本，将所述对象分类为不包括敏感信息。4.根据权利要求1所述的计算机实现的方法，其中基于所述对象类型的已知布局确定所述一个或多个特定区域中的每个特定区域的位置。5.根据权利要求1所述的计算机实现的方法，还包括：基于在所述第一对象上所述特定区域的位置，由所述计算设备用元数据来标记在所述第一对象的所述一个或多个特定区域中的每个特定区域中辨识出的所述文本，所述元数据指示在具有所述第一对象的所述对象类型的对象上的所述特定区域的所述位置处期望被发现的数据类型。6.根据权利要求5所述的计算机实现的方法，其中所述安全引擎还被配置为基于在所述文本上标记的所述元数据确定所述文本是否包括敏感信息。7.根据权...

【专利技术属性】
技术研发人员：R·艾比安东，左锦宇，
申请(专利权)人：赛门铁克公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人