一种文本自检模型的微调方法、装置、存储介质、设备制造方法及图纸

技术编号：43470458 阅读：19 留言：0更新日期：2024-11-27 13:08

本说明书公开了一种文本自检模型的微调方法、装置、存储介质、设备，获取原始文本自检模型中指定网络层的初始参数，针对所获取的每个指定网络层，对该指定网络层的初始参数进行降维，根据降维后的各指定网络层与所述原始文本自检模型，得到降维文本自检模型，将样本答复文本输入所述降维文本自检模型，得到所述降维文本自检模型输出的安全性评价，根据所述安全性评价与所述样本答复文本所对应的安全标签的差异，对所述降维文本自检模型进行调整，本方法可以降低文本自检模型微调过程对存储空间的需求，并降低进行微调时计算过程中的模型复杂度。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及计算机，尤其涉及一种文本自检模型的微调方法、装置、存储介质、设备。

技术介绍

1、随着大语言模型的发展，越来越多的
已经实现的大语言模型的部署及应用，其中，利用大语言模型为用户提供咨询服务是许多企业的常用选择。然而大语言模型针对用户的提问所输出的答复文本，可能存在违背法律法规或泄露企业隐私的敏感内容，由此便需要在将答复文本回复给用户之前，利用文本自检模型对生成的答复文本进行检测，对敏感内容进行处理。

2、然而，文本自检模型自身的参数量庞大，对文本自检模型进行模型训练对存储资源的要求极高。

3、由此，本专利技术，提供一种文本自检模型的微调方法、装置、存储介质、设备。

技术实现思路

1、本说明书提供一种文本自检模型的微调方法及装置，以部分的解决现有技术存在的上述问题。

2、本说明书采用下述技术方案：

3、本说明书提供了一种文本自检模型的微调方法，包括：

4、获取原始文本自检模型中指定网络层的初始参数；

5...

【技术保护点】

1.一种文本自检模型的微调方法，所述方法包括：

2.如权利要求1所述的方法，将样本答复文本输入所述降维文本自检模型，得到所述降维文本自检模型输出的安全性评价，具体包括：

3.如权利要求1或2所述的方法，对该指定网络层的初始参数进行降维，具体包括：

4.如权利要求3所述的方法，根据所述安全性评价与所述样本答复文本所对应的安全标签的差异，对所述降维文本自检模型进行调整,具体包括：

5.如权利要求4所述的方法，根据所述参数增量对所述降维文本自检模型进行调整，具体包括：

6.如权利要求4所述的方法，根据所述安全性评价与所述样本答复文本所...

【技术特征摘要】

1.一种文本自检模型的微调方法，所述方法包括：

2.如权利要求1所述的方法，将样本答复文本输入所述降维文本自检模型，得到所述降维文本自检模型输出的安全性评价，具体包括：

3.如权利要求1或2所述的方法，对该指定网络层的初始参数进行降维，具体包括：

4.如权利要求3所述的方法，根据所述安全性评价与所述样本答复文本所对应的安全标签的差异，对所述降维文本自检模型进行调整,具体包括：

5.如权利要求4所述的方法，根据所述参数增量对所述降维文本自检模型进行调整，具体包括：

【专利技术属性】
技术研发人员：田胜，但家旺，刘云飞，孟昌华，周璟，吴若凡，李金膛，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人