模型获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号：34391794 阅读：15 留言：0更新日期：2022-08-03 21:21

本公开提供了模型获取方法、装置、电子设备及存储介质，涉及深度学习以及自然语言处理等人工智能领域，其中的方法可包括：获取预训练得到的初始模型；针对预定类型的任务，生成所述任务对应的M种不同类型的对抗样本，M为大于一的正整数，并执行以下第一处理：将生成的对抗样本加入对抗样本集，结合对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练，得到所述任务对应的任务处理模型。应用本公开所述方案，可提升模型的鲁棒性。可提升模型的鲁棒性。可提升模型的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
模型获取方法、装置、电子设备及存储介质

[0001]本公开涉及人工智能
，特别涉及深度学习以及自然语言处理等领域的模型获取方法、装置、电子设备及存储介质。

技术介绍

[0002]文本匹配旨在判断两个文本的语义是否匹配，在实际应用中，可利用语义匹配模型来进行两个文本语义是否匹配的判断。
[0003]随着技术的发展，语义匹配模型在标准测试集上取得了较好的效果，但在面临输入上发生微小变化的情况时，经常不能做出符合预期的判断，鲁棒性较差。

技术实现思路

[0004]本公开提供了模型获取方法、装置、电子设备及存储介质。
[0005]一种模型获取方法，包括：
[0006]获取预训练得到的初始模型；
[0007]针对预定类型的任务，生成所述任务对应的M种不同类型的对抗样本，M为大于一的正整数，并执行以下第一处理：
[0008]将生成的对抗样本加入对抗样本集，结合所述对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练，得到所述任务对应的任务处理模型。
[0009]一种模型获取装置，包括：获取模块以及优化模块；
[0010]所述获取模块，用于获取预训练得到的初始模型；
[0011]所述优化模块，用于针对预定类型的任务，生成所述任务对应的M种不同类型的对抗样本，M为大于一的正整数，并执行以下第一处理：将生成的对抗样本加入对抗样本集，结合所述对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练，得到所述任务对应的任务处理模型。

【技术保护点】

【技术特征摘要】
1.一种模型获取方法，包括：获取预训练得到的初始模型；针对预定类型的任务，生成所述任务对应的M种不同类型的对抗样本，M为大于一的正整数，并执行以下第一处理：将生成的对抗样本加入对抗样本集，结合所述对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练，得到所述任务对应的任务处理模型。2.根据权利要求1所述的方法，还包括：所述结合所述对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练之后，确定是否符合结束条件；响应于确定符合结束条件，将最新得到的初始模型作为所述任务处理模型；响应于确定不符合结束条件，生成所述任务对应的N种不同类型的对抗样本，并重复执行所述第一处理，N为正整数，且N小于或等于M，所述M种不同类型中包括所述N种不同类型。3.根据权利要求1或2所述的方法，其中，所述M种不同类型的对抗样本包括以下至少两种：丢词类型的对抗样本，转义类型的对抗样本，反义类型的对抗样本，否定类型的对抗样本，句法变化类型的对抗样本，意图变化类型的对抗样本。4.根据权利要求1或2所述的方法，其中，针对任一种类型，分别按照以下方式生成所述类型的对抗样本：按照所述类型对应的样本生成规则，生成所述类型的对抗样本；或者，利用所述类型对应的样本生成模型，生成所述类型的对抗样本。5.根据权利要求2所述的方法，其中，所述生成所述任务对应的N种不同类型的对抗样本包括：获取所述最新得到的初始模型的评估结果；根据所述评估结果确定出需要生成的所述N种不同类型的对抗样本，并生成所述N种不同类型的对抗样本。6.根据权利要求5所述的方法，其中，所述生成所述任务对应的M种不同类型的对抗样本包括：针对所述M种不同类型，分别生成相同数量的对抗样本；所述生成所述任务对应的N种不同类型的对抗样本包括：按照对应类型的评估结果越差生成的对抗样本数量越多的原则，生成所述N种不同类型的对抗样本。7.一种模型获取装置，包括：获取模块以及优化模块；所述获取模块，用于获取预训练得到的初始模型；所述优化模块，用于针对预定类型的任务，生成所述任务对应的M种不同类型的对抗样本，M为大于一的正整数，并执行以下第一处理：将生成的对抗样本加入对抗样本集，结合所述对抗样本集以及所述任务对应的原...

【专利技术属性】
技术研发人员：陈艳，刘璟，颜璟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人