一种文本自检模型的微调方法、装置、存储介质、设备制造方法及图纸

技术编号:43470458 阅读:19 留言:0更新日期:2024-11-27 13:08
本说明书公开了一种文本自检模型的微调方法、装置、存储介质、设备,获取原始文本自检模型中指定网络层的初始参数,针对所获取的每个指定网络层,对该指定网络层的初始参数进行降维,根据降维后的各指定网络层与所述原始文本自检模型,得到降维文本自检模型,将样本答复文本输入所述降维文本自检模型,得到所述降维文本自检模型输出的安全性评价,根据所述安全性评价与所述样本答复文本所对应的安全标签的差异,对所述降维文本自检模型进行调整,本方法可以降低文本自检模型微调过程对存储空间的需求,并降低进行微调时计算过程中的模型复杂度。

【技术实现步骤摘要】

本说明书涉及计算机,尤其涉及一种文本自检模型的微调方法、装置、存储介质、设备


技术介绍

1、随着大语言模型的发展,越来越多的
已经实现的大语言模型的部署及应用,其中,利用大语言模型为用户提供咨询服务是许多企业的常用选择。然而大语言模型针对用户的提问所输出的答复文本,可能存在违背法律法规或泄露企业隐私的敏感内容,由此便需要在将答复文本回复给用户之前,利用文本自检模型对生成的答复文本进行检测,对敏感内容进行处理。

2、然而,文本自检模型自身的参数量庞大,对文本自检模型进行模型训练对存储资源的要求极高。

3、由此,本专利技术,提供一种文本自检模型的微调方法、装置、存储介质、设备。


技术实现思路

1、本说明书提供一种文本自检模型的微调方法及装置,以部分的解决现有技术存在的上述问题。

2、本说明书采用下述技术方案:

3、本说明书提供了一种文本自检模型的微调方法,包括:

4、获取原始文本自检模型中指定网络层的初始参数;

5、针对所获取的每个指本文档来自技高网...

【技术保护点】

1.一种文本自检模型的微调方法,所述方法包括:

2.如权利要求1所述的方法,将样本答复文本输入所述降维文本自检模型,得到所述降维文本自检模型输出的安全性评价,具体包括:

3.如权利要求1或2所述的方法,对该指定网络层的初始参数进行降维,具体包括:

4.如权利要求3所述的方法,根据所述安全性评价与所述样本答复文本所对应的安全标签的差异,对所述降维文本自检模型进行调整,具体包括:

5.如权利要求4所述的方法,根据所述参数增量对所述降维文本自检模型进行调整,具体包括:

6.如权利要求4所述的方法,根据所述安全性评价与所述样本答复文本所...

【技术特征摘要】

1.一种文本自检模型的微调方法,所述方法包括:

2.如权利要求1所述的方法,将样本答复文本输入所述降维文本自检模型,得到所述降维文本自检模型输出的安全性评价,具体包括:

3.如权利要求1或2所述的方法,对该指定网络层的初始参数进行降维,具体包括:

4.如权利要求3所述的方法,根据所述安全性评价与所述样本答复文本所对应的安全标签的差异,对所述降维文本自检模型进行调整,具体包括:

5.如权利要求4所述的方法,根据所述参数增量对所述降维文本自检模型进行调整,具体包括:

【专利技术属性】
技术研发人员:田胜但家旺刘云飞孟昌华周璟吴若凡李金膛
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1