【技术实现步骤摘要】
本文件涉及计算机,尤其涉及一种大模型的风险测评方法、装置及设备。
技术介绍
1、随着人们对自己的隐私数据越来越重视,为了保护用户隐私、保证数据的安全性,很多业务中会通过相应的模型来提供相关服务,当前,大模型处于高速发展阶段,极大推动了人工智能的进步,同时,大模型也带来了全新的安全问题,比如大模型幻觉、大模型输出不符合人类价值观的数据和大模型被恶意应用等。为了更好的评估大模型的安全能力,各种大模型安全测评框架也应运而生。为了判断大模型输出内容是否有风险,各种大模型安全测评框架往往依赖人工标注的方式来审核输出内容,而这样也增加了测评的成本,也限制了测评的规模化扩展。为此,本说明书实施例提供一种更优的针对大模型输出内容的风险评估方案。
技术实现思路
1、本说明书实施例的目的是提供一种更优的针对大模型输出内容的风险评估方案。
2、为了实现上述技术方案,本说明书实施例是这样实现的:
3、本说明书实施例提供的一种大模型的风险测评方法,所述方法包括:获取用于对目标大模型进行风险测
...【技术保护点】
1.一种大模型的风险测评方法,所述方法包括:
2.根据权利要求1所述的方法,所述方法还包括:
3.根据权利要求2所述的方法,所述确定每个辅助测试结果对应的标签信息,包括:
4.根据权利要求1所述的方法,获取用于对目标大模型进行风险测评的测试集中的测试数据,包括:
5.根据权利要求1所述的方法,所述从得到的辅助测试结果中查找与所述测试结果相匹配的目标辅助测试结果,包括:
6.根据权利要求5所述的方法,所述确定所述测试结果与得到的辅助测试结果中每个辅助测试结果之间的相似度,包括:
7.根据权利要求1所
...【技术特征摘要】
1.一种大模型的风险测评方法,所述方法包括:
2.根据权利要求1所述的方法,所述方法还包括:
3.根据权利要求2所述的方法,所述确定每个辅助测试结果对应的标签信息,包括:
4.根据权利要求1所述的方法,获取用于对目标大模型进行风险测评的测试集中的测试数据,包括:
5.根据权利要求1所述的方法,所述从得到的辅助测试结果中查找与所述测试结果相匹配的目标辅助测试结果,包括:
<...【专利技术属性】
技术研发人员:李红程,崔世文,洪丹,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。