【技术实现步骤摘要】
本公共的是信息保护。具体地,所公共的方面涉及在信息安全的背景下检测数据泄漏,其中敏感或机密数据已被传输或以其他方式分发给未授权目的地。另外的方面涉及检测已经对公众可用并且可能对人有害的危险信息。检测这种危险信息可能有助于用户安全。
技术介绍
1、泄漏的数据可能已经由可信代理或另一内部人员分发。传统上,通过加水印来处理数据泄漏检测,例如,在每个分发的副本中嵌入唯一代码。如果随后在未授权方手中发现副本,那么可识别泄漏者。检测泄漏数据的另一种方法是在入侵检测系统中使用模式匹配。又一种方法可以包括对加密数据的搜索操作。
2、在一些情况下,可以通过与语言模型交互来检测数据泄漏或危险信息,语言模型例如是基于生成式预训练变换器的大型语言模型(诸如chatgpt)。在一些情况下,语言模型是单词序列上的概率分布。大型语言模型可以具有至少一百万个参数或至少十亿个参数。
3、危险信息可能包括使用药物的不正确或错误指令、不应该公共的关于如何制造炸弹的指令、关于如何制造可能导致伤害的机器的不正确指令。
4、可以在大量未标记的人
...【技术保护点】
1.一种用于检测数据泄漏和/或检测危险信息的计算机实现的方法,所述方法包括:
2.根据权利要求1所述的方法,其中,使用所述知识图(100)确定所识别的陈述是真还是假包括确定所识别的陈述的主语-谓语组合是否具有最大基数;
3.根据权利要求1或2所述的方法,其中,所述至少一个网络服务包括以下中的一个或多个:web服务、社交网络服务、提供到语言模型的接口的服务;
4.根据前述权利要求中任一项所述的方法,还包括:
5.根据权利要求4所述的方法,其中,所述修改还包括:
6.根据权利要求4或5所述的方法,其中,计算所述向
...【技术特征摘要】
1.一种用于检测数据泄漏和/或检测危险信息的计算机实现的方法,所述方法包括:
2.根据权利要求1所述的方法,其中,使用所述知识图(100)确定所识别的陈述是真还是假包括确定所识别的陈述的主语-谓语组合是否具有最大基数;
3.根据权利要求1或2所述的方法,其中,所述至少一个网络服务包括以下中的一个或多个:web服务、社交网络服务、提供到语言模型的接口的服务;
4.根据前述权利要求中任一项所述的方法,还包括:
5.根据权利要求4所述的方法,其中,所述修改还包括:
6.根据权利要求4或5所述的方法,其中,计算所述向量,使得所述知识图(100)中的每个关系由两个向量表征,所述两个向量是超平面的范数向量和所述超平面上的转换向量,
7.根据权利要求5或6所述的方法,还包括:
8.根据前述权利要求中任一项所述的方法,还包括:
9.根据权利要求8所述的方法,还包括:
10.根据前述权利要求中任一项所述的方法,其中,确定所识别的陈述是真还是假以及确定所识别的陈述是公...
【专利技术属性】
技术研发人员:G·科斯塔,J·波尔蒂施,M·赫拉迪克,
申请(专利权)人:SAP欧洲公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。