【技术实现步骤摘要】
一种大模型风险管理框架构建的方法、装置及设备
[0001]本说明书涉及数据处理
,尤其涉及一种大模型风险管理框架构建的方法、装置及设备。
技术介绍
[0002]随着人工智能的发展,大模型被广泛应用于自然语言处理领域的人机交互中。大模型通常根据它在训练数据中学到的上下文来生成回答。训练数据的质量、数量和多样性对于大模型的表现至关重要。如果有足够的多样化数据,大模型就能够生成有用、有趣和正确的回答。
[0003]目前,人们对自己的隐私数据越来越关注,但是如果训练数据中包括了敏感和隐私的个人信息,大模型可能就会在不经意间将这些个人信息转换为生成内容。同样的,如果训练数据中存在意识形态与价值取向、不良信息、虚假信息、歧视等安全缺陷,大模型可能就会在生成内容中重现这些安全缺陷。现有的用于对大模型进行风险管控优化的大模型风险管理框架的难以满足风险管控需求。因此,目前亟需提供一种更优的大模型风险管理框架构建方案。
技术实现思路
[0004]本说明书实施例提供一种大模型风险管理框架构建的方法、装置及设备,以提供一种符合风险防控相关人员预期的大模型风险管理框架构建方案。
[0005]第一方面,本说明书一个或多个实施例提供一种大模型风险管理框架构建的方法,包括:基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签 ...
【技术保护点】
【技术特征摘要】
1.一种大模型风险管理框架构建的方法,所述大模型风险管理框架用于开发风险管理应用,所述方法,包括:基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。2.根据权利要求1所述的方法,所述从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,包括:根据所述标签定义,获取每个所述语料标签对应的主题和对所述主题进行解释的主题定义;从所述主题对应的所述主题定义中,提取标记所述主题对应的风险的主题关键词;所述根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,包括:根据所述主题定义和所述主题定义对应的所述标签定义,生成包含从所述主题定义中提取的所述主题关键词的所述文本语料。3.根据权利要求2所述的方法,所述根据所述标签定义,获取每个所述语料标签对应的主题和对所述主题进行解释的主题定义,包括:基于所述主题,对各个所述语料类型对应的所述原始文本语料进行主题标记处理;对不存在对应的主题的所述原始文本语料,设置至少一个补充主题并进行标记,标记有同一所述补充主题的原始文本语料的补充主题相同;基于标记有同一所述补充主题的所述原始文本语料,确定对所述补充主题进行解释的主题定义。4.根据权利要求2所述的方法,所述从所述主题对应的所述主题定义中,提取标记所述主题对应的风险的主题关键词,包括:从所述原始语料集的所述原始文本语料中,提取标记所述原始文本语料对应的风险的原始关键词;将具有相同所述主题的所述原始文本语料的主题关键词与原始关键词进行比对,得到目标关键词,所述目标关键词为所述主题关键词中不存在且所述原始关键词中存在的关键词;将所述目标关键词作为标记目标主题对应的风险的主题关键词,所述目标主题为所述目标关键词所属的所述原始文本语料对应的主题。5.根据权利要求1所述的方法,在生成文本语料后,所述方法,还包括:根据所述标签定义,对所述原始语料集的每个所述语料标签进行风险等级划分操作;将所述语料标签的风险等级作为具有所述语料标签的所述文本语料的风险等级。6.根据权利要求1所述的方法,所述基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签,包括:
获取所述大模型风险管理框架的应用场景信息;根据所述应用场景信息,从所述原始语料集中筛选出与所述大模型风险管理框架的应用场景相关的目标文本语料;基于所述目标文本语料,确定各个所述语料类型的语料标签。7.根据权利要求1所述的方法,所述根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的...
【专利技术属性】
技术研发人员:鲜东,曹汉杰,张家齐,杨舟,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。