【技术实现步骤摘要】
本公开总体上涉及计算机网络系统和方法,特别专注于保护敏感数据。更特别地,本公开涉及使用人工智能(例如机器学习)进行多模态数据丢失保护(dlp)的系统和方法。
技术介绍
1、在计算、网络、信息技术(it)、网络安全等领域,数据丢失保护(dlp),也称为数据丢失预防,简称为数据保护(当指保护方面时)或简称为数据丢失(当指检测方面或问题本身时),涉及保护敏感企业数据的各个方面。当然,公司或任何组织的数据都是其最重要的资产之一,任何损失或盗窃都会带来重大的经济风险。企业数据可以通过不同的方式泄露,即通过电子邮件、网络邮件、云存储、社交媒体和各种其他应用,以及简单地连接存储设备和复制文件。公司能够使用预定义的模板(如正则表达式匹配)为敏感数据格式制定策略,以避免数据泄露。例如,2023年11月28日发布的题为“cloud-based data lossprevention”的共同转让的美国专利第11829347号中描述了dlp的一些现有方法,其全部内容通过引用并入本文。这些方法通常要求公司提供词典,检测技术包括精确数据匹配(edm),其中标记了特
...【技术保护点】
1.一种用于多模态数据丢失保护(DLP)的方法(650),包括以下步骤:
2.如权利要求1所述的方法(650),其中,所述步骤包括:
3.如权利要求1至2中任一项所述的方法(650),其中,所述步骤包括:
4.如权利要求1至3中任一项所述的方法(650),其中,所述多种格式包括文本格式、图像格式、音频格式、视频格式、源代码及其组合。
5.如权利要求1至4中任一项所述的方法(650),其中,所述处理输入以确定所述数据是否包括敏感数据利用了(1)大语言模型(LLM)和嵌入,以及(2)配置用于分类的机器学习模型。
...
【技术特征摘要】
1.一种用于多模态数据丢失保护(dlp)的方法(650),包括以下步骤:
2.如权利要求1所述的方法(650),其中,所述步骤包括:
3.如权利要求1至2中任一项所述的方法(650),其中,所述步骤包括:
4.如权利要求1至3中任一项所述的方法(650),其中,所述多种格式包括文本格式、图像格式、音频格式、视频格式、源代码及其组合。
5.如权利要求1至4中任一项所述的方法(650),其中,所述处理输入以确定所述数据是否包括敏感数据利用了(1)大语言模型(llm)和嵌入,以及(2)配置用于分类的机器学习模型。
6.如权利要求1至5中任一项所述的方法(650),其中,所述处理输入以将所述输入分类到类别中利用了(1)大语言模型(llm)和(2)零样本分类器。
7.如权利要求1至6中任一项所述的方法(650),其中,所述处理输入以确定所述数据是否包括敏感数据以及所述处理输入以将所述输入分类到类别中两者都利用了基于带有标记的训练文档集训练得到的一个或更多个机器学习模型。
8.如...
【专利技术属性】
技术研发人员:胡晨晖,卡比尔·纳格普,张淼,雷克斯·商,雅各布·博林格,阿伦·巴姆杜尼,克劳迪奥诺·N·小科埃略,桑杰·卡尔拉,维韦克·沙拉特,巴拉克里什南·巴特·巴亚尔,
申请(专利权)人:兹斯卡勒公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。