【技术实现步骤摘要】
本专利技术涉及电数字数据处理领域,具体涉及一种自然语言模型的生成对抗式样本处理系统。
技术介绍
1、自然语言模型是人工智能的基础模型,自然语言模型能够正确地识别出对话信息并给予反馈,而在自然语言模型的训练过程中,样本数据的质量会直接影响自然语言模型的应用效果,而样本数据大部分从正常对话数据中直接获取,导致模型的鲁棒性较低,容易产生过拟合现象,无法正确处理一些特殊信息,因此,需要一种系统能够生成用于训练的对抗式样本来提高模型的鲁棒性。
2、
技术介绍
的前述论述仅意图便于理解本专利技术。此论述并不认可或承认提及的材料中的任一种公共常识的一部分。
3、现在已经开发出了很多样本生成系统,经过大量的检索与参考,发现现有的样本生成系统有如公开号为cn113222480b所公开的系统,这些系统方法一般包括:首先获取原始样本构成的样本集,其中包括正常样本和风险样本;还获取风险检测模型及其对应的损失函数。针对样本集中各个原始样本,利用生成模型生成扰动变换,并将其叠加在对应原始样本上,得到各个原始样本对应的各个变换样本;利用风险检测模
...【技术保护点】
1.一种自然语言模型的生成对抗式样本处理系统,其特征在于,包括模型对接模块、对抗策略处理模块、对抗样本生成模块、样本评估模块和迭代优化模块;
2.如权利要求1所述的一种自然语言模型的生成对抗式样本处理系统,其特征在于,所述样本解析单元包括样本寄存器、拆解处理器和编码处理器,所述样本寄存器用于接收并保存样本信息,所述拆解处理器用于将样本信息拆解成多个单独的词汇,所述编码处理器将词汇转换成对应的词汇码,并根据词汇的位置在编码中添加词性码,由词性码和词汇码构成解析码。
3.如权利要求2所述的一种自然语言模型的生成对抗式样本处理系统,其特征在于,所述策
...【技术特征摘要】
1.一种自然语言模型的生成对抗式样本处理系统,其特征在于,包括模型对接模块、对抗策略处理模块、对抗样本生成模块、样本评估模块和迭代优化模块;
2.如权利要求1所述的一种自然语言模型的生成对抗式样本处理系统,其特征在于,所述样本解析单元包括样本寄存器、拆解处理器和编码处理器,所述样本寄存器用于接收并保存样本信息,所述拆解处理器用于将样本信息拆解成多个单独的词汇,所述编码处理器将词汇转换成对应的词汇码,并根据词汇的位置在编码中添加词性码,由词性码和词汇码构成解析码。
3.如权利要求2所述的一种自然语言模型的生成对抗式样本处理系统,其特征在于,所述策略应用单元包括策略寄...
【专利技术属性】
技术研发人员:张卫平,李显阔,王晶,邵胜博,王丹,
申请(专利权)人:环球数科集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。