检测数据泄漏和/或检测危险信息制造技术

技术编号：45069329 阅读：17 留言：0更新日期：2025-04-25 18:13

各方面涉及用于检测数据泄漏和/或检测危险信息的计算机实现的方法、计算机程序和计算机系统。该方法包括接收知识图并从至少一个网络服务提取数据。该方法还包括识别所提取的数据中的陈述。对于每个所识别的陈述，该方法还包括使用知识图确定所识别的陈述是公共的还是私有的，和/或使用知识图确定所识别的陈述是真还是假。

全部详细技术资料下载

【技术实现步骤摘要】

本公共的是信息保护。具体地，所公共的方面涉及在信息安全的背景下检测数据泄漏，其中敏感或机密数据已被传输或以其他方式分发给未授权目的地。另外的方面涉及检测已经对公众可用并且可能对人有害的危险信息。检测这种危险信息可能有助于用户安全。

技术介绍

1、泄漏的数据可能已经由可信代理或另一内部人员分发。传统上，通过加水印来处理数据泄漏检测，例如，在每个分发的副本中嵌入唯一代码。如果随后在未授权方手中发现副本，那么可识别泄漏者。检测泄漏数据的另一种方法是在入侵检测系统中使用模式匹配。又一种方法可以包括对加密数据的搜索操作。

2、在一些情况下，可以通过与语言模型交互来检测数据泄漏或危险信息，语言模型例如是基于生成式预训练变换器的大型语言模型(诸如chatgpt)。在一些情况下，语言模型是单词序列上的概率分布。大型语言模型可以具有至少一百万个参数或至少十亿个参数。

3、危险信息可能包括使用药物的不正确或错误指令、不应该公共的关于如何制造炸弹的指令、关于如何制造可能导致伤害的机器的不正确指令。

4、可以在大量未标记的人...

【技术保护点】

1.一种用于检测数据泄漏和/或检测危险信息的计算机实现的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，使用所述知识图(100)确定所识别的陈述是真还是假包括确定所识别的陈述的主语-谓语组合是否具有最大基数；

3.根据权利要求1或2所述的方法，其中，所述至少一个网络服务包括以下中的一个或多个：web服务、社交网络服务、提供到语言模型的接口的服务；

4.根据前述权利要求中任一项所述的方法，还包括：

5.根据权利要求4所述的方法，其中，所述修改还包括：

6.根据权利要求4或5所述的方法，其中，计算所述向量，使得所述知识图(...

【技术特征摘要】

1.一种用于检测数据泄漏和/或检测危险信息的计算机实现的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，使用所述知识图(100)确定所识别的陈述是真还是假包括确定所识别的陈述的主语-谓语组合是否具有最大基数；

3.根据权利要求1或2所述的方法，其中，所述至少一个网络服务包括以下中的一个或多个：web服务、社交网络服务、提供到语言模型的接口的服务；

4.根据前述权利要求中任一项所述的方法，还包括：

5.根据权利要求4所述的方法，其中，所述修改还包括：

6.根据权利要求4或5所述的方法，其中，计算所述向量，使得所述知识图(100)中的每个关系由两个向量表征，所述两个向量是超平面的范数向量和所述超平面上的转换向量，

7.根据权利要求5或6所述的方法，还包括：

8.根据前述权利要求中任一项所述的方法，还包括：

9.根据权利要求8所述的方法，还包括：

10.根据前述权利要求中任一项所述的方法，其中，确定所识别的陈述是真还是假以及确定所识别的陈述是公...

【专利技术属性】
技术研发人员：G·科斯塔，J·波尔蒂施，M·赫拉迪克，
申请(专利权)人：SAP欧洲公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人