使用人工智能的多模态数据丢失保护制造技术

技术编号:45801389 阅读:6 留言:0更新日期:2025-07-11 20:15
用于多模态数据丢失保护(DLP)的多模态数据损失保护(DLP)方法(650)包括接收(652)包括多种格式中的任何一种格式的数据的输入;处理(654)输入以确定所述数据是否包括敏感数据;以及响应于(656)所述输入包括敏感数据,执行以下步骤:处理输入以将输入分类到多个类别的类别中;以及提供所述多个类别的该类别的指示。该方法利用人工智能和机器学习,其中经过训练的多模态系统能够处理和整合来自各种模态的信息,即文本、图像、声音、视频等。

【技术实现步骤摘要】

本公开总体上涉及计算机网络系统和方法,特别专注于保护敏感数据。更特别地,本公开涉及使用人工智能(例如机器学习)进行多模态数据丢失保护(dlp)的系统和方法。


技术介绍

1、在计算、网络、信息技术(it)、网络安全等领域,数据丢失保护(dlp),也称为数据丢失预防,简称为数据保护(当指保护方面时)或简称为数据丢失(当指检测方面或问题本身时),涉及保护敏感企业数据的各个方面。当然,公司或任何组织的数据都是其最重要的资产之一,任何损失或盗窃都会带来重大的经济风险。企业数据可以通过不同的方式泄露,即通过电子邮件、网络邮件、云存储、社交媒体和各种其他应用,以及简单地连接存储设备和复制文件。公司能够使用预定义的模板(如正则表达式匹配)为敏感数据格式制定策略,以避免数据泄露。例如,2023年11月28日发布的题为“cloud-based data lossprevention”的共同转让的美国专利第11829347号中描述了dlp的一些现有方法,其全部内容通过引用并入本文。这些方法通常要求公司提供词典,检测技术包括精确数据匹配(edm),其中标记了特定的关键字、数据类别本文档来自技高网...

【技术保护点】

1.一种用于多模态数据丢失保护(DLP)的方法(650),包括以下步骤:

2.如权利要求1所述的方法(650),其中,所述步骤包括:

3.如权利要求1至2中任一项所述的方法(650),其中,所述步骤包括:

4.如权利要求1至3中任一项所述的方法(650),其中,所述多种格式包括文本格式、图像格式、音频格式、视频格式、源代码及其组合。

5.如权利要求1至4中任一项所述的方法(650),其中,所述处理输入以确定所述数据是否包括敏感数据利用了(1)大语言模型(LLM)和嵌入,以及(2)配置用于分类的机器学习模型。

6.如权利要求1至5...

【技术特征摘要】

1.一种用于多模态数据丢失保护(dlp)的方法(650),包括以下步骤:

2.如权利要求1所述的方法(650),其中,所述步骤包括:

3.如权利要求1至2中任一项所述的方法(650),其中,所述步骤包括:

4.如权利要求1至3中任一项所述的方法(650),其中,所述多种格式包括文本格式、图像格式、音频格式、视频格式、源代码及其组合。

5.如权利要求1至4中任一项所述的方法(650),其中,所述处理输入以确定所述数据是否包括敏感数据利用了(1)大语言模型(llm)和嵌入,以及(2)配置用于分类的机器学习模型。

6.如权利要求1至5中任一项所述的方法(650),其中,所述处理输入以将所述输入分类到类别中利用了(1)大语言模型(llm)和(2)零样本分类器。

7.如权利要求1至6中任一项所述的方法(650),其中,所述处理输入以确定所述数据是否包括敏感数据以及所述处理输入以将所述输入分类到类别中两者都利用了基于带有标记的训练文档集训练得到的一个或更多个机器学习模型。

8.如...

【专利技术属性】
技术研发人员:胡晨晖卡比尔·纳格普张淼雷克斯·商雅各布·博林格阿伦·巴姆杜尼克劳迪奥诺·N·小科埃略桑杰·卡尔拉维韦克·沙拉特巴拉克里什南·巴特·巴亚尔
申请(专利权)人:兹斯卡勒公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1