风险数据检测方法及装置制造方法及图纸

技术编号：40443702 阅读：6 留言：0更新日期：2024-02-22 23:05

本申请公开了一种风险数据检测方法及装置，涉及计算机技术领域。方法包括：获取大语言模型的输入数据以及对应的输入向量；利用输入向量，从输入检测集中确定目标风险向量和目标安全向量，其中，目标风险向量为与输入向量最相似的风险向量，目标安全向量为与输入向量最相似的安全向量；利用输入向量、目标风险向量以及目标安全向量，计算第一参数和第二参数，并确定输入数据的初步检测结果；若初步检测结果为安全数据，对输出数据进行异常检测，以确定输入数据的最终检测结果，输出数据为利用大语言模型对输入数据进行推理所得到的数据。采用本发明专利技术，可有效检测风险数据，避免大语言模型输出包含敏感内容的数据，提升大语言模型的安全性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，具体涉及一种风险数据检测方法及装置。

技术介绍

1、大语言模型（large language model，llm）是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务，如文本分类、问答、对话等。

2、提示词是一种提供给大语言模型的文本，可用于引导大语言模型完成特定的任务，例如，在和大语言模型对话时，可利用提示词引导其给出更加精准的回答。

3、然而，提示词除了可引导大语言模型更加出色地完成任务，也可以引导其输出包含敏感内容的数据，例如，违规数据或者隐私数据等。这类提示词对于大语言模型而言是风险数据，目前，亟需一种方式对风险数据进行有效检测，以提升大语言模型的安全性。

技术实现思路

1、本申请实施例提供一种风险数据检测方法及装置，可以有效检测风险数据，以提升大语言模型的安全性。

2、本申请实施例提供一种风险数据检测方法，该方法包括：

3、获取大语言模型的输入数据，以及所述输入数据对应的输入向量，所述输入数据为文本形式的提示词；

4、利用所述输入向量，从输入检测集中确定目标风险向量和目标安全向量，其中，所述输入检测集包括每个风险提示词对应的风险向量以及每个安全提示词对应的安全向量，所述目标风险向量为所述输入检测集中与所述输入向量最相似的风险向量，所述目标安全向量为所述输入检测集中与所述输入向量最相似的安全向量；其中，与所述输入向量最相似的风险向量是

5、利用所述输入向量、所述目标风险向量以及所述目标安全向量，计算第一参数和第二参数；

6、根据所述第一参数和所述第二参数，确定所述输入数据的初步检测结果；

7、若所述初步检测结果为安全数据，对输出数据进行异常检测，以确定所述输入数据的最终检测结果，所述输出数据为利用所述大语言模型对所述输入数据进行推理所得到的数据。

8、本申请实施例还提供一种风险数据检测装置，该装置包括：

9、获取模块，用于获取大语言模型的输入数据，以及所述输入数据对应的输入向量，所述输入数据为文本形式的提示词；

10、确定模块，用于利用所述输入向量，从输入检测集中确定目标风险向量和目标安全向量，其中，所述输入检测集包括每个风险提示词对应的风险向量以及每个安全提示词对应的安全向量，所述目标风险向量为所述输入检测集中与所述输入向量最相似的风险向量，所述目标安全向量为所述输入检测集中与所述输入向量最相似的安全向量；其中，与所述输入向量最相似的风险向量是指与所述输入向量的余弦距离最小的风险向量，与所述输入向量最相似的安全向量是指与所述输入向量的余弦距离最小的安全向量；

11、计算模块，用于利用所述输入向量、所述目标风险向量以及所述目标安全向量，计算第一参数和第二参数；

12、初步检测模块，用于根据所述第一参数和所述第二参数，确定所述输入数据的初步检测结果；

13、最终检测模块，用于若所述初步检测结果为安全数据，对输出数据进行异常检测，以确定所述输入数据的最终检测结果，所述输出数据为利用所述大语言模型对所述输入数据进行推理所得到的数据。

14、本申请实施例还提供一种电子设备，包括处理器和存储器，所述存储器存储有多条指令；所述处理器从所述存储器中加载指令，以执行本申请实施例所提供的任一种风险数据检测方法中的步骤。

15、本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本申请实施例所提供的任一种风险数据检测方法中的步骤。

16、本申请实施例可以获取到大语言模型的输入数据，以及该输入数据对应的输出向量，通过该输入向量从输入检测集中确定出目标风险向量和目标安全向量；再根据输入向量、目标风险向量以及目标安全向量，计算第一参数和第二参数，再利用第一参数和第二参数，先确定输入数据的初步检测结果；在初步检测结果为安全数据时，继续对输入数据对应的输出数据进行异常检测，以确定出输入数据的最终检测结果。通过计算第一参数和第二参数可准确地确定初步检测结果，在初步检测结果为安全数据时，继续对输出数据进行异常检测，可实现全面的检测，避免风险数据引导大语言模型输出敏感信息，从而提升大语言模型的安全性。

本文档来自技高网...

【技术保护点】

1.一种风险数据检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一参数和所述第二参数通过如下公式计算得到：

3.根据权利要求1所述的方法，其特征在于，所述输入检测集中包括所述风险向量对应的风险提示词，所述根据所述第一参数和所述第二参数，确定所述输入数据的初步检测结果，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述输入数据和所述风险提示词之间的文本相似度，确定所述输入数据的初步检测结果，包括：

5.根据权利要求1所述的方法，其特征在于，若所述初步检测结果为安全数据，对输出数据进行异常检测，以确定所述输入数据的最终检测结果，包括：

6.根据权利要求5所述的方法，其特征在于，将所述输入数据以及所述输入向量写入缓存队列中之后，所述方法还包括：

7.根据权利要求5所述的方法，其特征在于，所述输出检测集中包括多个输出风险词，所述根据输出检测集、所述指定输出中的所述输出数据以及输出关键词，确定所述输入数据的最终检测结果，包括：

8.根据权利要求5或7所述的方

9.根据权利要求8所述的方法，其特征在于，所述第三参数通过如下公式计算得到：

10.一种风险数据检测装置，其特征在于，所述装置包括：

...

【技术特征摘要】

1.一种风险数据检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一参数和所述第二参数通过如下公式计算得到：

4.根据权利要求3所述的方法，其特征在于，所述根据所述输入数据和所述风险提示词之间的文本相似度，确定所述输入数据的初步检测结果，包括：

5.根据权利要求1所述的方法，其特征在于，若所述初步检测结果为安全数据，对输出数据进行异常检测，以确定所述输入数据的最终检测...

【专利技术属性】
技术研发人员：胡跃，屠静，王亚，
申请(专利权)人：卓世智星天津科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人