大语言模型输入内容合规检测方法、装置及设备制造方法及图纸

技术编号：46600485 阅读：0 留言：0更新日期：2025-10-10 21:32

本发明专利技术公开了一种大语言模型输入内容合规检测方法、装置及设备。基于BERT模型对文本内容进行处理，结合上下文语义初步判断文本内容中是否存在敏感词，在文本内容存在敏感词时，调用GPT模型对文本内容进一步进行敏感词提取，在提取到敏感词时，向用户返回拒绝生成内容的提示信息，在未提取到敏感词时，将文本内容输入大语言模型中进行处理，生成文本内容对应的内容，并返回给用户，提高了敏感词检测效率和准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自然语言处理技术，尤其涉及一种大语言模型输入内容合规检测方法、装置及设备。

技术介绍

1、随着生成式人工智能（artificial intelligence generated content，简称aigc）的蓬勃发展，有效地提升了总体社会生产力。其中，大语言模型（large languagemodel，简称llm）是众多aigc应用中的翘楚。目前，大语言模型在文本、图像、音频等多个模态场景下皆拥有了相当可观的能力，大语言模型已经能够很好地识别并满足人类用户的一般需求，能够有效地降低了人工生产和服务成本。

2、大语言模型通常基于用户输入的内容进行推理，并生成相应的内容返回给用户。但是，如果用户输入的内容存在敏感词，可能会污染大语言模型，导致大语言模型输出违规内容。

3、目前，大多采用关键词匹配的方式对用户输入内容中的敏感词进行拦截，但是，这种方式需要建立庞大的敏感词库，处理效率低下，且关键词匹配的方式不考虑上下文语义，容易出现误检或漏检。

技术实现思路

>1、本专利技术提供本文档来自技高网...

【技术保护点】

1.一种大语言模型输入内容合规检测方法，其特征在于，包括：

2.根据权利要求1所述的大语言模型输入内容合规检测方法，其特征在于，还包括：

3.根据权利要求1或2所述的大语言模型输入内容合规检测方法，其特征在于，基于BERT模型对所述文本内容进行处理，结合上下文语义判定所述文本内容中是否存在敏感词，包括：

4.根据权利要求3所述的大语言模型输入内容合规检测方法，其特征在于，在将所述第一融合向量输入编码层中进行处理之前，还包括：

5.根据权利要求3所述的大语言模型输入内容合规检测方法，其特征在于，在将所述第一融合向量输入编码层中进行处理之前，还...

【技术特征摘要】

1.一种大语言模型输入内容合规检测方法，其特征在于，包括：

2.根据权利要求1所述的大语言模型输入内容合规检测方法，其特征在于，还包括：

3.根据权利要求1或2所述的大语言模型输入内容合规检测方法，其特征在于，基于bert模型对所述文本内容进行处理，结合上下文语义判定所述文本内容中是否存在敏感词，包括：

4.根据权利要求3所述的大语言模型输入内容合规检测方法，其特征在于，在将所述第一融合向量输入编码层中进行处理之前，还包括：

5.根据权利要求3所述的大语言模型输入内容合规检测方法，其...

【专利技术属性】
技术研发人员：邹鹤良，张报明，李祖金，贺学尧，邹雅丽，
申请(专利权)人：数字广东网络建设有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人