【技术实现步骤摘要】
路段生成模型的训练方法、路段生成方法及装置
[0001]本申请涉及人工智能
,特别涉及一种路段生成模型的训练方法、路段生成方法及装置。
技术介绍
[0002]随着计算机技术的不断发展,游戏的种类和数量也越来越多,目前已出现了赛车类游戏、跑酷类游戏等。例如,在赛车类游戏中,玩家可以操控虚拟车辆在不同的虚拟道路上跑动,虚拟道路可以视作多个路段首尾连接而成,通常虚拟道路的路段样式越丰富,玩家的游戏体验越好。
[0003]相关技术中,采用基于监督学习的路段生成模型来生成路段。例如,将已有虚拟道路的路段作为样本路段,采用变分自编码(Variational Auto Encoder,VAE)技术,对样本路段的路段信息进行编码拟合,然后基于编码后的路段向量,对路段生成模型进行训练,利用训练后的路段生成模型来生成新路段。
[0004]然而,上述方法中,由于从已有虚拟道路中提取的样本路段数量有限,从而训练得到的路段生成模型会出现过拟合问题,难以生成多个样式不同的新路段,导致路段生成效率较低。
技术实现思路
>[0005]本申请本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种路段生成模型的训练方法,其特征在于,所述方法包括:获取路段生成模型和多个样本路段的路段信息,所述路段生成模型包括路段编码器和路段生成器,所述路段编码器用于对路段的路段信息进行编码,得到所述路段的路段向量,所述路段生成器用于基于所述路段的路段向量,生成与所述路段相邻的下一个路段的路段信息;基于多个所述样本路段的路段信息,对所述路段生成器和所述路段编码器依次进行训练;其中,在训练所述路段生成器的过程中,保持所述路段编码器的网络参数不变,通过所述路段生成器,生成多个参考路段的路段信息,基于多个所述样本路段的路段信息和多个所述参考路段的路段信息,对所述路段生成器的网络参数进行更新;在训练所述路段编码器的过程中,保持所述路段生成器的网络参数不变,通过所述路段编码器,对输入的第一路段的路段信息进行编码,得到所述第一路段的路段向量,通过所述路段生成器,基于所述第一路段的路段向量,生成第二路段的路段信息,基于相邻的两个所述样本路段的路段信息、所述第一路段的路段信息以及所述第二路段的路段信息,对所述路段编码器的网络参数进行更新,所述第二路段是指与所述第一路段相邻的下一个路段。2.根据权利要求1所述的方法,其特征在于,所述通过所述路段生成器,生成多个参考路段的路段信息,基于多个所述样本路段的路段信息和多个所述参考路段的路段信息,对所述路段生成器的网络参数进行更新,包括:通过所述路段生成器,基于多个参考向量,生成各个所述参考向量对应的所述参考路段的路段信息,所述参考向量通过对路段向量的参考分布进行采样得到;基于多个所述样本路段的路段信息和多个所述参考路段的路段信息,对所述路段生成器的网络参数和第一判别器的网络参数交替进行更新,以得到更新后的所述路段生成器和更新后的所述第一判别器,所述第一判别器用于判别路段是否为所述样本路段。3.根据权利要求2所述的方法,其特征在于,所述路段向量的参考分布为均匀分布,所述参考向量通过对所述均匀分布进行随机采样得到。4.根据权利要求2所述的方法,其特征在于,所述基于多个所述样本路段的路段信息和多个所述参考路段的路段信息,对所述路段生成器的网络参数和第一判别器的网络参数交替进行更新,以得到更新后的所述路段生成器和更新后的所述第一判别器,包括:在第i轮交替更新中,基于多个所述样本路段的路段信息和多个所述参考路段的路段信息,确定所述第一判别器的损失值,基于所述第一判别器的损失值,对所述第一判别器的网络参数进行更新,以得到更新后的所述第一判别器,i为正整数;将多个所述参考路段的路段信息分别输入更新后的所述第一判别器,输出各个所述参考路段的判别结果,所述参考路段的判别结果指示所述参考路段是否为所述样本路段;基于各个所述参考路段的判别结果,确定所述路段生成器的损失值,基于所述路段生成器的损失值,对所述路段生成器的网络参数进行更新,以得到更新后的所述路段生成器。5.根据权利要求1所述的方法,其特征在于,所述通过所述路段编码器,对输入的第一路段的路段信息进行编码,得到所述第一路段的路段向量,通过所述路段生成器,基于所述第一路段的路段向量,生成第二路段的路段信息,基于相邻的两个所述样本路段的路段信
息、所述第一路段的路段信息以及所述第二路段的路段信息,对所述路段编码器的网络参数进行更新,包括:通过所述路段编码器,对所述第一路段的路段信息进行编码,得到所述第一路段的路段向量,通过所述路段生成器,基于所述第一路段的路段向量,生成所述第二路段的路段信息;基于相邻的两个所述样本路段的路段信息、所述第一路段的路段信息以及所述第二路段的路段信息,对所述路段编码器的网络参数和第二判别器的网络参数交替进行更新,以得到更新后的所述路段编码器和更新后的所述第二判别器,所述第二判别器用于判别相邻的两个路段是否为相邻的两个所述样本路段。6.根据权利要求5所述的方法,其特征在于,所述基于相邻的两个所述样本路段的路段信息、所述第一路段的路段信息以及所述第二路段的路段信息,对所述路段编码器的网络参数和第二判别器的网络参数交替进行更新,以得到更新后的所述路段编码器和更新后的所述第二判别器,包括:在第q轮交替更新中,基于相邻的两个所述样本路段的路段信息、所述第一路段的路段信息以及所述第二路段的路段信息,确定所述第二判别器的损失值,基于所述第二判别器的损失值,对所述第二判别器的网络参数进行更新,以得到更新后的所述第二判别器,q为正整数;将所述第一路段的路段信息和所述第二路段的路段信息输入更新后的所述第二判别器,输出所述第一路段和所述第二路段的判别结果,所述第一路段和所述第二路段的判别结果指示所述第一路段和所述第二路段是否为相邻的两个所述样本路段;基于所述第二路段的路段信息以及所述第一路段和所述第二路段的判别结果,确定所述路段编码器的损失值,基于所述路段编码器的损失值,对所述路段编码器的网络参数进行更新,以得到更新后的所述路段编码器。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述通过所述路段编码器,对输入的第一路段的路段信息进行编码,得到所述第一路段的路段向量,包括:通过所述路段编码器,对期望路段信息和所述第一路...
【专利技术属性】
技术研发人员:李世迪,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。