【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种基于大语言模型的敏感提问识别方法、装置、设备及介质。
技术介绍
1、大语言模型(large language model,llm)是一种基于transformer的生成式深度学习模型。随着人工智能技术的不断发展,各大企业都相继推出了自己的各种大模型,以用来解决各种信息检索、代码生成、写作辅助等工作。
2、但是,现有的大语言模型还无法有效识别各种敏感性提问,用户往往可以通过一些手段绕过敏感性提问的检测。例如:可以通过提示词注入、提示词泄露等手段攻击大语言模型以绕过敏感性提问的检测。其中,提示词注入是指用户使用提示词让模型输出用户任何想要的话,提示词泄露是指使用提示词让模型泄露如个人隐私等敏感信息。
3、当大语言模型未能识别这些敏感提问而如实回答时可能会有法律风险、隐私泄露风险,而当大语言模型误拒绝回答非敏感性提问时又会影响用户的正常使用体验。
4、鉴于以上问题,如何基于大语言模型进行有效的敏感提问识别成为了亟待解决的问题。
技术实现思路
1、本本文档来自技高网...
【技术保护点】
1.一种基于大语言模型的敏感提问识别方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的敏感提问识别方法,其特征在于,所述安全提示词包括对敏感提问的识别策略及响应策略;所述规范提示词包括对所述大语言模型的响应形式规范策略。
3.根据权利要求1所述的基于大语言模型的敏感提问识别方法,其特征在于,所述计算每个数据点的主成分,包括:
4.根据权利要求3所述的基于大语言模型的敏感提问识别方法,其特征在于,所述根据每个数据点的主成分计算每个数据点对应的拒绝响应概率及敏感提问判别概率,包括:
5.根据权利要求4所述的基
...【技术特征摘要】
1.一种基于大语言模型的敏感提问识别方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的敏感提问识别方法,其特征在于,所述安全提示词包括对敏感提问的识别策略及响应策略;所述规范提示词包括对所述大语言模型的响应形式规范策略。
3.根据权利要求1所述的基于大语言模型的敏感提问识别方法,其特征在于,所述计算每个数据点的主成分,包括:
4.根据权利要求3所述的基于大语言模型的敏感提问识别方法,其特征在于,所述根据每个数据点的主成分计算每个数据点对应的拒绝响应概率及敏感提问判别概率,包括:
5.根据权利要求4所述的基于大语言模型的敏感提问识别方法,其特征在于,所述根据每个数据点对应的拒绝响应概率及敏感提问判别概率创建目标损失函数,包括:
6.根据权利要求1所述的基于大语言模型的敏感提问识别方法,其...
【专利技术属性】
技术研发人员:陈东来,
申请(专利权)人:深圳前海环融联易信息科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。