【技术实现步骤摘要】
本专利技术涉及自然语言处理技术,尤其涉及一种大语言模型输入内容合规检测方法、装置及设备。
技术介绍
1、随着生成式人工智能(artificial intelligence generated content,简称aigc)的蓬勃发展,有效地提升了总体社会生产力。其中,大语言模型(large languagemodel,简称llm)是众多aigc应用中的翘楚。目前,大语言模型在文本、图像、音频等多个模态场景下皆拥有了相当可观的能力,大语言模型已经能够很好地识别并满足人类用户的一般需求,能够有效地降低了人工生产和服务成本。
2、大语言模型通常基于用户输入的内容进行推理,并生成相应的内容返回给用户。但是,如果用户输入的内容存在敏感词,可能会污染大语言模型,导致大语言模型输出违规内容。
3、目前,大多采用关键词匹配的方式对用户输入内容中的敏感词进行拦截,但是,这种方式需要建立庞大的敏感词库,处理效率低下,且关键词匹配的方式不考虑上下文语义,容易出现误检或漏检。
技术实现思路
【技术保护点】
1.一种大语言模型输入内容合规检测方法,其特征在于,包括:
2.根据权利要求1所述的大语言模型输入内容合规检测方法,其特征在于,还包括:
3.根据权利要求1或2所述的大语言模型输入内容合规检测方法,其特征在于,基于BERT模型对所述文本内容进行处理,结合上下文语义判定所述文本内容中是否存在敏感词,包括:
4.根据权利要求3所述的大语言模型输入内容合规检测方法,其特征在于,在将所述第一融合向量输入编码层中进行处理之前,还包括:
5.根据权利要求3所述的大语言模型输入内容合规检测方法,其特征在于,在将所述第一融合向量输入编码
...【技术特征摘要】
1.一种大语言模型输入内容合规检测方法,其特征在于,包括:
2.根据权利要求1所述的大语言模型输入内容合规检测方法,其特征在于,还包括:
3.根据权利要求1或2所述的大语言模型输入内容合规检测方法,其特征在于,基于bert模型对所述文本内容进行处理,结合上下文语义判定所述文本内容中是否存在敏感词,包括:
4.根据权利要求3所述的大语言模型输入内容合规检测方法,其特征在于,在将所述第一融合向量输入编码层中进行处理之前,还包括:
5.根据权利要求3所述的大语言模型输入内容合规检测方法,其...
【专利技术属性】
技术研发人员:邹鹤良,张报明,李祖金,贺学尧,邹雅丽,
申请(专利权)人:数字广东网络建设有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。