当前位置: 首页 > 专利查询>SAP欧洲公司专利>正文

检测数据泄漏和/或检测危险信息制造技术

技术编号:45069329 阅读:17 留言:0更新日期:2025-04-25 18:13
各方面涉及用于检测数据泄漏和/或检测危险信息的计算机实现的方法、计算机程序和计算机系统。该方法包括接收知识图并从至少一个网络服务提取数据。该方法还包括识别所提取的数据中的陈述。对于每个所识别的陈述,该方法还包括使用知识图确定所识别的陈述是公共的还是私有的,和/或使用知识图确定所识别的陈述是真还是假。

【技术实现步骤摘要】

本公共的是信息保护。具体地,所公共的方面涉及在信息安全的背景下检测数据泄漏,其中敏感或机密数据已被传输或以其他方式分发给未授权目的地。另外的方面涉及检测已经对公众可用并且可能对人有害的危险信息。检测这种危险信息可能有助于用户安全。


技术介绍

1、泄漏的数据可能已经由可信代理或另一内部人员分发。传统上,通过加水印来处理数据泄漏检测,例如,在每个分发的副本中嵌入唯一代码。如果随后在未授权方手中发现副本,那么可识别泄漏者。检测泄漏数据的另一种方法是在入侵检测系统中使用模式匹配。又一种方法可以包括对加密数据的搜索操作。

2、在一些情况下,可以通过与语言模型交互来检测数据泄漏或危险信息,语言模型例如是基于生成式预训练变换器的大型语言模型(诸如chatgpt)。在一些情况下,语言模型是单词序列上的概率分布。大型语言模型可以具有至少一百万个参数或至少十亿个参数。

3、危险信息可能包括使用药物的不正确或错误指令、不应该公共的关于如何制造炸弹的指令、关于如何制造可能导致伤害的机器的不正确指令。

4、可以在大量未标记的人类可读文本上以无监督本文档来自技高网...

【技术保护点】

1.一种用于检测数据泄漏和/或检测危险信息的计算机实现的方法,所述方法包括:

2.根据权利要求1所述的方法,其中,使用所述知识图(100)确定所识别的陈述是真还是假包括确定所识别的陈述的主语-谓语组合是否具有最大基数;

3.根据权利要求1或2所述的方法,其中,所述至少一个网络服务包括以下中的一个或多个:web服务、社交网络服务、提供到语言模型的接口的服务;

4.根据前述权利要求中任一项所述的方法,还包括:

5.根据权利要求4所述的方法,其中,所述修改还包括:

6.根据权利要求4或5所述的方法,其中,计算所述向量,使得所述知识图(...

【技术特征摘要】

1.一种用于检测数据泄漏和/或检测危险信息的计算机实现的方法,所述方法包括:

2.根据权利要求1所述的方法,其中,使用所述知识图(100)确定所识别的陈述是真还是假包括确定所识别的陈述的主语-谓语组合是否具有最大基数;

3.根据权利要求1或2所述的方法,其中,所述至少一个网络服务包括以下中的一个或多个:web服务、社交网络服务、提供到语言模型的接口的服务;

4.根据前述权利要求中任一项所述的方法,还包括:

5.根据权利要求4所述的方法,其中,所述修改还包括:

6.根据权利要求4或5所述的方法,其中,计算所述向量,使得所述知识图(100)中的每个关系由两个向量表征,所述两个向量是超平面的范数向量和所述超平面上的转换向量,

7.根据权利要求5或6所述的方法,还包括:

8.根据前述权利要求中任一项所述的方法,还包括:

9.根据权利要求8所述的方法,还包括:

10.根据前述权利要求中任一项所述的方法,其中,确定所识别的陈述是真还是假以及确定所识别的陈述是公...

【专利技术属性】
技术研发人员:G·科斯塔J·波尔蒂施M·赫拉迪克
申请(专利权)人:SAP欧洲公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1