【技术实现步骤摘要】
本说明书涉及计算机,尤其涉及一种文本自检模型的微调方法、装置、存储介质、设备。
技术介绍
1、随着大语言模型的发展,越来越多的
已经实现的大语言模型的部署及应用,其中,利用大语言模型为用户提供咨询服务是许多企业的常用选择。然而大语言模型针对用户的提问所输出的答复文本,可能存在违背法律法规或泄露企业隐私的敏感内容,由此便需要在将答复文本回复给用户之前,利用文本自检模型对生成的答复文本进行检测,对敏感内容进行处理。
2、然而,文本自检模型自身的参数量庞大,对文本自检模型进行模型训练对存储资源的要求极高。
3、由此,本专利技术,提供一种文本自检模型的微调方法、装置、存储介质、设备。
技术实现思路
1、本说明书提供一种文本自检模型的微调方法及装置,以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种文本自检模型的微调方法,包括:
4、获取原始文本自检模型中指定网络层的初始参数;
5
...【技术保护点】
1.一种文本自检模型的微调方法,所述方法包括:
2.如权利要求1所述的方法,将样本答复文本输入所述降维文本自检模型,得到所述降维文本自检模型输出的安全性评价,具体包括:
3.如权利要求1或2所述的方法,对该指定网络层的初始参数进行降维,具体包括:
4.如权利要求3所述的方法,根据所述安全性评价与所述样本答复文本所对应的安全标签的差异,对所述降维文本自检模型进行调整,具体包括:
5.如权利要求4所述的方法,根据所述参数增量对所述降维文本自检模型进行调整,具体包括:
6.如权利要求4所述的方法,根据所述安全性评价
...【技术特征摘要】
1.一种文本自检模型的微调方法,所述方法包括:
2.如权利要求1所述的方法,将样本答复文本输入所述降维文本自检模型,得到所述降维文本自检模型输出的安全性评价,具体包括:
3.如权利要求1或2所述的方法,对该指定网络层的初始参数进行降维,具体包括:
4.如权利要求3所述的方法,根据所述安全性评价与所述样本答复文本所对应的安全标签的差异,对所述降维文本自检模型进行调整,具体包括:
5.如权利要求4所述的方法,根据所述参数增量对所述降维文本自检模型进行调整,具体包括:
【专利技术属性】
技术研发人员:田胜,但家旺,刘云飞,孟昌华,周璟,吴若凡,李金膛,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。