模型获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34391794 阅读:15 留言:0更新日期:2022-08-03 21:21
本公开提供了模型获取方法、装置、电子设备及存储介质,涉及深度学习以及自然语言处理等人工智能领域,其中的方法可包括:获取预训练得到的初始模型;针对预定类型的任务,生成所述任务对应的M种不同类型的对抗样本,M为大于一的正整数,并执行以下第一处理:将生成的对抗样本加入对抗样本集,结合对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练,得到所述任务对应的任务处理模型。应用本公开所述方案,可提升模型的鲁棒性。可提升模型的鲁棒性。可提升模型的鲁棒性。

【技术实现步骤摘要】
模型获取方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
,特别涉及深度学习以及自然语言处理等领域的模型获取方法、装置、电子设备及存储介质。

技术介绍

[0002]文本匹配旨在判断两个文本的语义是否匹配,在实际应用中,可利用语义匹配模型来进行两个文本语义是否匹配的判断。
[0003]随着技术的发展,语义匹配模型在标准测试集上取得了较好的效果,但在面临输入上发生微小变化的情况时,经常不能做出符合预期的判断,鲁棒性较差。

技术实现思路

[0004]本公开提供了模型获取方法、装置、电子设备及存储介质。
[0005]一种模型获取方法,包括:
[0006]获取预训练得到的初始模型;
[0007]针对预定类型的任务,生成所述任务对应的M种不同类型的对抗样本,M为大于一的正整数,并执行以下第一处理:
[0008]将生成的对抗样本加入对抗样本集,结合所述对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练,得到所述任务对应的任务处理模型。
[0009]一种模型获取装置,包括:获取模块以及优化模块;
[0010]所述获取模块,用于获取预训练得到的初始模型;
[0011]所述优化模块,用于针对预定类型的任务,生成所述任务对应的M种不同类型的对抗样本,M为大于一的正整数,并执行以下第一处理:将生成的对抗样本加入对抗样本集,结合所述对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练,得到所述任务对应的任务处理模型。
[0012]一种电子设备,包括:
[0013]至少一个处理器;以及
[0014]与所述至少一个处理器通信连接的存储器;其中,
[0015]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。
[0016]一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行如以上所述的方法。
[0017]一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如以上所述的方法。
[0018]上述公开中的一个实施例具有如下优点或有益效果:可针对预定类型的任务,生成多种不同类型的对抗样本,进而可结合生成的对抗样本以及原始训练样本来对初始模型进行有针对性地优化训练,从而提升了模型的鲁棒性。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0021]图1为本公开所述模型获取方法第一实施例的流程图;
[0022]图2为本公开所述模型获取方法第二实施例的流程图;
[0023]图3为本公开所述模型获取装置实施例300的组成结构示意图;
[0024]图4示出了可以用来实施本公开的实施例的电子设备400的示意性框图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0026]另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0027]图1为本公开所述模型获取方法第一实施例的流程图。如图1所示,包括以下具体实现方式。
[0028]在步骤101中,获取预训练得到的初始模型。
[0029]在步骤102中,针对预定类型的任务,生成所述任务对应的M种不同类型的对抗样本,M为大于一的正整数,并执行以下第一处理:将生成的对抗样本加入对抗样本集,结合对抗样本集以及所述任务对应的原始样本集对初始模型进行训练,得到所述任务对应的任务处理模型。
[0030]上述方法实施例所述方案中,可针对预定类型的任务,生成多种不同类型的对抗样本,进而可结合生成的对抗样本以及原始训练样本来对初始模型进行有针对性地优化训练,从而提升了模型的鲁棒性。
[0031]上述方法实施例所述方案可应用于深度学习以及自然语言处理等人工智能领域。在按照图1所示流程获取到任务处理模型后,可利用所述任务处理模型对所述预定类型的任务进行任务处理,从而得到处理结果。比如,所述预定类型的任务可为文本匹配任务,所述任务处理模型可为语义匹配模型,相应地,在按照图1所示流程获取到语义匹配模型后,可利用所述语义匹配模型进行文本匹配处理,如利用所述语义匹配模型确定两个文本的语义是否匹配,并得到是否匹配的判定结果。
[0032]本公开的一个实施例中,还可循环执行上述第一处理,即结合对抗样本集以及原始样本集对初始模型进行训练之后,可确定是否符合结束条件,响应于确定符合结束条件,可将最新得到的初始模型作为所需的任务处理模型,响应于确定不符合结束条件,可生成所述任务对应的N种不同类型的对抗样本,并重复执行所述第一处理,N为正整数,且N小于或等于M,所述M种不同类型中包括所述N种不同类型。
[0033]通过上述处理,可实现对于初始模型的不断迭代优化,从而进一步提升了模型的鲁棒性。
[0034]假设M的取值为6,那么N的取值可以等于6,也可以小于6,即可以再次生成6种不同类型的对抗样本,也可以只生成其中的部分类型的对抗样本。
[0035]如何确定是否符合结束条件不作限制。比如,可获取最新得到的初始模型的评估结果,若根据评估结果确定初始模型针对不同的情况均可较好的进行处理,则可认为符合结束条件,进而可将最新得到的初始模型作为所需的任务处理模型,反之,可继续进行迭代优化。
[0036]本公开的一个实施例中,所述M种不同类型的对抗样本可包括以下至少两种:丢词类型的对抗样本,转义类型的对抗样本,反义类型的对抗样本,否定类型的对抗样本,句法变化类型的对抗样本,意图变化类型的对抗样本。
[0037]其中,丢词类型的对抗样本可如以下表一所示:
[0038]类型说明典型例子丢词词汇丢失地球多大了地球多大
[0039]表一丢词类型的对抗样本转义类型的对抗样本可如以下表二所示:
[0040]类型说明典型例子转义词汇不匹配菠萝怎么吃菠菜怎么吃
[0041]表二转义类型的对抗样本反义类型的对抗样本可如以下表三所示:
[0042]类型说明典型例子反义反义词靴筒松了怎么办靴筒太紧怎么办
[0043]表三反义类型的对抗样本否定类型的对抗样本可如以下表四所示:...

【技术保护点】

【技术特征摘要】
1.一种模型获取方法,包括:获取预训练得到的初始模型;针对预定类型的任务,生成所述任务对应的M种不同类型的对抗样本,M为大于一的正整数,并执行以下第一处理:将生成的对抗样本加入对抗样本集,结合所述对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练,得到所述任务对应的任务处理模型。2.根据权利要求1所述的方法,还包括:所述结合所述对抗样本集以及所述任务对应的原始样本集对所述初始模型进行训练之后,确定是否符合结束条件;响应于确定符合结束条件,将最新得到的初始模型作为所述任务处理模型;响应于确定不符合结束条件,生成所述任务对应的N种不同类型的对抗样本,并重复执行所述第一处理,N为正整数,且N小于或等于M,所述M种不同类型中包括所述N种不同类型。3.根据权利要求1或2所述的方法,其中,所述M种不同类型的对抗样本包括以下至少两种:丢词类型的对抗样本,转义类型的对抗样本,反义类型的对抗样本,否定类型的对抗样本,句法变化类型的对抗样本,意图变化类型的对抗样本。4.根据权利要求1或2所述的方法,其中,针对任一种类型,分别按照以下方式生成所述类型的对抗样本:按照所述类型对应的样本生成规则,生成所述类型的对抗样本;或者,利用所述类型对应的样本生成模型,生成所述类型的对抗样本。5.根据权利要求2所述的方法,其中,所述生成所述任务对应的N种不同类型的对抗样本包括:获取所述最新得到的初始模型的评估结果;根据所述评估结果确定出需要生成的所述N种不同类型的对抗样本,并生成所述N种不同类型的对抗样本。6.根据权利要求5所述的方法,其中,所述生成所述任务对应的M种不同类型的对抗样本包括:针对所述M种不同类型,分别生成相同数量的对抗样本;所述生成所述任务对应的N种不同类型的对抗样本包括:按照对应类型的评估结果越差生成的对抗样本数量越多的原则,生成所述N种不同类型的对抗样本。7.一种模型获取装置,包括:获取模块以及优化模块;所述获取模块,用于获取预训练得到的初始模型;所述优化模块,用于针对预定类型的任务,生成所述任务对应的M种不同类型的对抗样本,M为大于一的正整数,并执行以下第一处理:将生成的对抗样本加入对抗样本集,结合所述对抗样本集以及所述任务对应的原...

【专利技术属性】
技术研发人员:陈艳刘璟颜璟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1