大语言模型输入内容合规检测方法、装置及设备制造方法及图纸

技术编号:46600485 阅读:0 留言:0更新日期:2025-10-10 21:32
本发明专利技术公开了一种大语言模型输入内容合规检测方法、装置及设备。基于BERT模型对文本内容进行处理,结合上下文语义初步判断文本内容中是否存在敏感词,在文本内容存在敏感词时,调用GPT模型对文本内容进一步进行敏感词提取,在提取到敏感词时,向用户返回拒绝生成内容的提示信息,在未提取到敏感词时,将文本内容输入大语言模型中进行处理,生成文本内容对应的内容,并返回给用户,提高了敏感词检测效率和准确率。

【技术实现步骤摘要】

本专利技术涉及自然语言处理技术,尤其涉及一种大语言模型输入内容合规检测方法、装置及设备


技术介绍

1、随着生成式人工智能(artificial intelligence generated content,简称aigc)的蓬勃发展,有效地提升了总体社会生产力。其中,大语言模型(large languagemodel,简称llm)是众多aigc应用中的翘楚。目前,大语言模型在文本、图像、音频等多个模态场景下皆拥有了相当可观的能力,大语言模型已经能够很好地识别并满足人类用户的一般需求,能够有效地降低了人工生产和服务成本。

2、大语言模型通常基于用户输入的内容进行推理,并生成相应的内容返回给用户。但是,如果用户输入的内容存在敏感词,可能会污染大语言模型,导致大语言模型输出违规内容。

3、目前,大多采用关键词匹配的方式对用户输入内容中的敏感词进行拦截,但是,这种方式需要建立庞大的敏感词库,处理效率低下,且关键词匹配的方式不考虑上下文语义,容易出现误检或漏检。


技术实现思路

>1、本专利技术提供本文档来自技高网...

【技术保护点】

1.一种大语言模型输入内容合规检测方法,其特征在于,包括:

2.根据权利要求1所述的大语言模型输入内容合规检测方法,其特征在于,还包括:

3.根据权利要求1或2所述的大语言模型输入内容合规检测方法,其特征在于,基于BERT模型对所述文本内容进行处理,结合上下文语义判定所述文本内容中是否存在敏感词,包括:

4.根据权利要求3所述的大语言模型输入内容合规检测方法,其特征在于,在将所述第一融合向量输入编码层中进行处理之前,还包括:

5.根据权利要求3所述的大语言模型输入内容合规检测方法,其特征在于,在将所述第一融合向量输入编码层中进行处理之前,还...

【技术特征摘要】

1.一种大语言模型输入内容合规检测方法,其特征在于,包括:

2.根据权利要求1所述的大语言模型输入内容合规检测方法,其特征在于,还包括:

3.根据权利要求1或2所述的大语言模型输入内容合规检测方法,其特征在于,基于bert模型对所述文本内容进行处理,结合上下文语义判定所述文本内容中是否存在敏感词,包括:

4.根据权利要求3所述的大语言模型输入内容合规检测方法,其特征在于,在将所述第一融合向量输入编码层中进行处理之前,还包括:

5.根据权利要求3所述的大语言模型输入内容合规检测方法,其...

【专利技术属性】
技术研发人员:邹鹤良张报明李祖金贺学尧邹雅丽
申请(专利权)人:数字广东网络建设有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1