【技术实现步骤摘要】
一种模型训练的方法、数据生成的方法以及装置
本申请涉及人工智能
,具体涉及一种模型训练的方法、数据生成的方法以及装置。
技术介绍
人工智能(artificialintelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。近些年来,在人工智能领域,使用领域自适应策略来解决图像分类、检测等任务成为热点。领域自适应是指利用数据、任务或模型之间的相似性,将在源领域学习过的模型,应用于目标领域的一种学习过程。通过源领域的数据生成大量优质的目标域数据,有利于根据获取到的大量优质的目标域数据训练获取性能更好的模型,因此如何根据源领域的数据生成大量优质的目标域数据亟待解决。
技术实现思路
本申请实 ...
【技术保护点】
1.一种模型训练的方法,其特征在于,包括:/n根据未携带标签的源域数据、目标域有标签数据对目标模型进行迭代训练,所述目标模型包括第一生成模型和第一判别模型,其中,每次迭代训练,包括:/n将未携带标签的源域数据输入至第一生成模型,以输出第一生成结果;/n将所述源域数据未携带的标签和所述第一生成结果进行组合,以获取第一组合数据;/n将所述第一组合数据以及所述目标域有标签数据输入至所述第一判别模型中,以输出第一判别结果;/n根据所述第一判别结果获取第一损失值;/n固定所述第一生成模型的参数,根据所述第一损失值更新所述第一判别模型,或者固定所述第一判别模型的参数,根据所述第一损失值 ...
【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:
根据未携带标签的源域数据、目标域有标签数据对目标模型进行迭代训练,所述目标模型包括第一生成模型和第一判别模型,其中,每次迭代训练,包括:
将未携带标签的源域数据输入至第一生成模型,以输出第一生成结果;
将所述源域数据未携带的标签和所述第一生成结果进行组合,以获取第一组合数据;
将所述第一组合数据以及所述目标域有标签数据输入至所述第一判别模型中,以输出第一判别结果;
根据所述第一判别结果获取第一损失值;
固定所述第一生成模型的参数,根据所述第一损失值更新所述第一判别模型,或者固定所述第一判别模型的参数,根据所述第一损失值更新所述第一生成模型。
2.根据权利要求1所述的方法,其特征在于,所述目标模型还包括第二生成模型,所述方法还包括:
将所述第一生成结果输入至第二生成模型,以输出第二生成结果;
根据所述第二生成结果和所述未携带标签的源域数据之间的差异获取第二损失值;
所述根据所述第一损失值更新所述第一生成模型,包括:
根据所述第一损失值和所述第二损失值更新所述第一生成模型,所述第二损失值还用于更新所述第二生成模型。
3.根据权利要求1或2所述的方法,其特征在于,所述根据未携带标签的源域数据、目标域有标签数据对目标模型进行迭代训练,包括:
根据所述未携带标签的源域数据、目标域有标签数据以及目标域无标签数据对目标模型进行迭代训练。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述目标模型还包括第二判别模型,所述每次迭代训练还包括:
将所述第一生成结果和预设标签进行组合,以获取第二组合数据;
将目标域无标签数据和所述预设标签进行组合,以获取第三组合数据;
将所述第二组合数据以及所述第三组合数据输入至第二判别模型中,以输出第二判别结果;
根据所述第二判别结果获取第三损失值;
所述根据所述第一损失值更新所述第一判别模型,包括:
根据所述第一损失值和所述第三损失值更新所述第一判别模型;
所述根据所述第一损失值更新所述第一生成模型,包括:
根据所述第一损失值和所述第三损失值更新所述第一生成模型。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述目标模型还包括第一分类模型,所述每次迭代训练还包括:
将所述目标域无标签数据输入至第一分类模型中,以输出第一预测标签;
将所述目标域无标签数据和所述第一预测标签进行组合,以获取第四组合数据;
将所述第四组合数据输入至所述第一判别模型中,以输出第三判别结果;
根据所述第三判别结果获取第四损失值;
所述根据所述第一损失值更新所述第一判别模型,包括:
固定所述第一生成模型的参数和所述第一分类模型的参数,根据所述第一损失值和所述第四损失值更新所述第一判别模型;
所述每次迭代训练还包括:
固定所述第一判别模型的参数,根据所述第四损失值更新所述第一分类模型。
6.根据权利要求5所述的方法,其特征在于,所述目标模型还包括第二分类模型,所述每次迭代训练还包括:
将所述第一生成结果和所述目标域有标签数据输入至第二分类模型中,以输出第二预测标签;
根据所述第二预测标签获取第五损失值;
所述根据所述第四损失值更新所述第一分类模型,包括:
根据所述第四损失值和所述第五损失值更新所述第一分类模型,所述第四损失值和所述第五损失值还用于更新所述第二分类模型。
7.一种数据生成的方法,其特征在于,包括:
获取未携带标签的源域数据;
将所述未携带标签的源域数据输入至目标生成模型中,以获取目标域数据;
其中,所述目标生成模型是通过未携带标签的源域训练数据、目标域有标签训练数据对目标模型进行迭代训练后获取的,所述目标模型包括第一生成模型和第一判别模型,所述目标生成模型是训练后的所述第一生成模型,所述目标生成模型的参数是通过固定所述第一判别模型的参数,通过第一损失值更新所述第一生成模型的参数获取的,所述第一损失值还用于固定所述第一生成模型的参数时,更新所述第一判别模型,所述第一损失值是根据第一判别结果获取的,所述第一判别结果是根据第一组合训练数据以及所述目标域有标签训练数据输入至所述第一判别模型中获取的,所述第一组合数据是将所述源域训练数据未携带的标签和所述第一生成结果进行组合后获取的,所述第一生成结果是将所述未携带标签的源域训练数据输入至所述第一生成模型后获取的。
8.根据权利要求7所述的方法,其特征在于,所述目标模型还包括第二生成模型,所述目标生成模型的参数具体是通过固定所述第一判别模型的参数,通过第一损失值和第二损失值更新所述第一生成模型的参数获取的,所述第二损失值是根据第二生成结果和所述未携带标签的源域训练数据之间的差异获取的,所述第二生成结果是将所述第一生成结果输入至所述第二生成模型获取的,所述第二损失值还用于更新所述第二生成模型。
9.根据权利要求7或8所述的方法,其特征在于,所述目标生成模型具体是通过未携带标签的源域训练数据、目标域有标签训练数据以及目标域无标签训练数据对目标模型进行迭代训练后获取的。
10.根据权利要求7至9任一项所述的方法,其特征在于,所述目标模型还包括第二判别模型,所述目标生成模型的参数具体是通过固定所述第一判别模型的参数,所述第一损失值和第三损失值更新所述第一生成模型的参数获取的,所述第三损失值是通过第二判别结果获取的,所述第二判别结果是将第二组合数据以及第三组合数据输入至所述第二判别模型中获取的,所述第二组合数据是将所述第一生成结果和预设标签进行组合后获取的,所述第三组合数据是将所述标域无标签训练数据和所述预设标签进行组合后获取的,所述第一损失值和所述第三损失值还用于更新所述第一判别模型。
11.根据权利要求8至10任一项所述的方法,其特征在于,还包括:
将所述目标域训练数据输入至目标分类模型中,以获取预测结果,其中,所述目标分类模型是固定所述第一判别模型的参数,通过第四损失值更新第一分类模型获取的,所述第四损失值是通过第三判别结果获取的,所述第三判别结果是通过将第四组合数据输入至所述第一判别模型中获取的,所述第四组合数据是将所述目标域无标签训练数据和所述第一预测标签进行组合后获取的,所述第一预测标签是将所述目标域无标签训练数据输入至所述第一分类模型中获取的,所述第四损失值还用于固定所述第一生成模型的参数和所述第一分类模型的参数时,更新所述第一判别模型。
12.根据权利要求11所述的方法,其特征在于,所述目标模型还包括第二分类模型,所述目标分类模型具体是固定所述第一判别模型的参数,通过第四损失值和第五损失值更新所述第一分类模型获取的,所述第五损失值是通过第二预测标签获取的,所述第二预测标签是通过将所述第一生成结果和所述目标域有标签训练数据输入至第二分类模型中获取的,所述第四损失值和所述第五损失值还用于更新所述第二分类模型。
13.一种模型训练的装置,其特征在于,包括:
训练模块,用于根据未携带标签的源域数据、目标域有标签数据对目标模型进行迭代训练,所述目标模型包括第一生成模型和第一判别模型,所述训练模块包括输入模块、组合模块、获取模块以及更新模块,其中,每次迭代训练时,
所述输入模块,用于将未携带标签的源域数据输入至第一生成模型,以输出第一生成结果;
所述组合模块,用于将所述源域数据未携带的标签和所述第一生成结果进行组合,以获取第一组合数据;
所述输入模块,还用于将所述第一组合数据以及所述目标域有标签数据输入至所述第一判别模型中,以输出第一判别结果;
所述获取模块,用于根据所述第一判别结果获取第一损失值;
所述更新模块,用于固定所述第一生成模型的参数,根据所述第一损失值更新所述第一判别模...
【专利技术属性】
技术研发人员:刘智立,罗琪竣,洪蓝青,李崇轩,朱军,李震国,
申请(专利权)人:华为技术有限公司,清华大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。