一种自然语言模型的生成对抗式样本处理系统技术方案

技术编号:40319337 阅读:22 留言:0更新日期:2024-02-07 21:02
本发明专利技术提供了一种自然语言模型的生成对抗式样本处理系统,涉及电数字数据处理领域,包括模型对接模块、对抗策略处理模块、对抗样本生成模块、样本评估模块和迭代优化模块,所述模型对接模块用于与自然语言模型进行对接并接收模型的训练样本,所述对抗策略处理模块设置对抗策略信息,所述对抗样本生成模块根据对抗策略对训练样本进行处理生成对抗样本,所述样本评估模块用于将对抗样本在模型中运行并筛选出对抗性不足的对抗样本,所述迭代优化模块用于将筛选出的对抗样本进行迭代处理提高对抗性;本系统能够生成对抗样本能够从而有效缓解语言模型过拟合,提高模型的鲁棒性和安全性。

【技术实现步骤摘要】

本专利技术涉及电数字数据处理领域,具体涉及一种自然语言模型的生成对抗式样本处理系统


技术介绍

1、自然语言模型是人工智能的基础模型,自然语言模型能够正确地识别出对话信息并给予反馈,而在自然语言模型的训练过程中,样本数据的质量会直接影响自然语言模型的应用效果,而样本数据大部分从正常对话数据中直接获取,导致模型的鲁棒性较低,容易产生过拟合现象,无法正确处理一些特殊信息,因此,需要一种系统能够生成用于训练的对抗式样本来提高模型的鲁棒性。

2、
技术介绍
的前述论述仅意图便于理解本专利技术。此论述并不认可或承认提及的材料中的任一种公共常识的一部分。

3、现在已经开发出了很多样本生成系统,经过大量的检索与参考,发现现有的样本生成系统有如公开号为cn113222480b所公开的系统,这些系统方法一般包括:首先获取原始样本构成的样本集,其中包括正常样本和风险样本;还获取风险检测模型及其对应的损失函数。针对样本集中各个原始样本,利用生成模型生成扰动变换,并将其叠加在对应原始样本上,得到各个原始样本对应的各个变换样本;利用风险检测模型确定各个变换样本的本文档来自技高网...

【技术保护点】

1.一种自然语言模型的生成对抗式样本处理系统,其特征在于,包括模型对接模块、对抗策略处理模块、对抗样本生成模块、样本评估模块和迭代优化模块;

2.如权利要求1所述的一种自然语言模型的生成对抗式样本处理系统,其特征在于,所述样本解析单元包括样本寄存器、拆解处理器和编码处理器,所述样本寄存器用于接收并保存样本信息,所述拆解处理器用于将样本信息拆解成多个单独的词汇,所述编码处理器将词汇转换成对应的词汇码,并根据词汇的位置在编码中添加词性码,由词性码和词汇码构成解析码。

3.如权利要求2所述的一种自然语言模型的生成对抗式样本处理系统,其特征在于,所述策略应用单元包括策略寄...

【技术特征摘要】

1.一种自然语言模型的生成对抗式样本处理系统,其特征在于,包括模型对接模块、对抗策略处理模块、对抗样本生成模块、样本评估模块和迭代优化模块;

2.如权利要求1所述的一种自然语言模型的生成对抗式样本处理系统,其特征在于,所述样本解析单元包括样本寄存器、拆解处理器和编码处理器,所述样本寄存器用于接收并保存样本信息,所述拆解处理器用于将样本信息拆解成多个单独的词汇,所述编码处理器将词汇转换成对应的词汇码,并根据词汇的位置在编码中添加词性码,由词性码和词汇码构成解析码。

3.如权利要求2所述的一种自然语言模型的生成对抗式样本处理系统,其特征在于,所述策略应用单元包括策略寄...

【专利技术属性】
技术研发人员:张卫平李显阔王晶邵胜博王丹
申请(专利权)人:环球数科集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1