信息处理方法和装置以及信息检测方法和装置制造方法及图纸

技术编号：20993309 阅读：55 留言：0更新日期：2019-04-29 23:04

公开了一种信息处理方法和装置以及信息检测方法和装置，其中信息处理方法包括：从训练集中抽取对应于相同的语义特征的三幅图像，所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像；通过变分自编码器获得三幅图像的与语义特征对应的隐变量的分布；以及对于所述三幅图像中的每幅图像，通过使损失函数最小化来更新变分自编码器的参数，其中损失函数与第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离正相关，与第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离负相关。根据本公开的实施例，可以提取具有区分度的面部语义特征。

Information processing methods and devices, information detection methods and devices

An information processing method and apparatus, as well as an information detection method and apparatus are disclosed, in which the information processing method includes: extracting three images corresponding to the same semantic features from a training set, the three images including the first and second images having the same semantic features in terms of semantic features, and the first and second images having different semantic features from the first and second images. Three images; obtaining the distribution of hidden variables corresponding to the semantic features of three images by variational self-encoding; and updating the parameters of variational self-encoding by minimizing the loss function for each image in the three images, where the loss function is positively correlated with the distribution of hidden variables of the first image and the distribution of hidden variables of the second image, and with the distribution of hidden variables of the third image. The distribution of the hidden variables in the first image is negatively correlated with the distribution of the hidden variables in the third image by the second distance. According to embodiments of the present disclosure, facial semantic features with distinctive degrees can be extracted.

全部详细技术资料下载

【技术实现步骤摘要】
信息处理方法和装置以及信息检测方法和装置
本公开涉及信息处理领域，具体涉及能够提取具有区分度的面部语义特征的信息处理方法和装置以及信息检测方法和装置。
技术介绍
近年来在图像生成方面取得了显著进步。出现了诸如生成式对抗网络(GAN)和变分自编码器(VAE)的模型来生成图像。然而，GAN模型以随机噪声作为输入，并且不具有将图像编码到隐空间的能力。VAE可以将图像编码到隐空间，然而该隐空间缺乏语义含义。即，这些模型不能提取具有区分度的面部语义特征。
技术实现思路
在下文中给出了关于本公开的简要概述，以便提供关于本公开的某些方面的基本理解。但是，应当理解，这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分，也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念，以此作为稍后给出的更详细描述的前序。鉴于以上问题，本公开的目的是提供能够提取具有区分度的面部语义特征的信息处理方法和装置以及信息检测方法和装置。根据本公开的一方面，提供了一种信息处理方法，包括：可以从训练集中抽取对应于相同的语义特征的三幅图像，所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像；可以通过变分自编码器获得三幅图像的与语义特征对应的隐变量的分布；以及可以对于所述三幅图像中的每幅图像，通过使损失函数最小化来更新变分自编码器的参数，其中损失函数与第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离正相关，与第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离...

【技术保护点】
1.一种信息处理方法，包括：从训练集中抽取对应于相同的语义特征的三幅图像，其中，所述三幅图像包括在所述语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于所述第一图像和所述第二图像的第三图像；通过变分自编码器获得所述三幅图像的与所述语义特征对应的隐变量的分布；以及对于所述三幅图像中的每幅图像，通过使损失函数最小化来更新所述变分自编码器的参数，其中所述损失函数与所述第一图像的隐变量的分布和所述第二图像的隐变量的分布之间的第一距离正相关，与所述第一图像的隐变量的分布和所述第三图像的隐变量的分布之间的第二距离负相关。

【技术特征摘要】
1.一种信息处理方法，包括：从训练集中抽取对应于相同的语义特征的三幅图像，其中，所述三幅图像包括在所述语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于所述第一图像和所述第二图像的第三图像；通过变分自编码器获得所述三幅图像的与所述语义特征对应的隐变量的分布；以及对于所述三幅图像中的每幅图像，通过使损失函数最小化来更新所述变分自编码器的参数，其中所述损失函数与所述第一图像的隐变量的分布和所述第二图像的隐变量的分布之间的第一距离正相关，与所述第一图像的隐变量的分布和所述第三图像的隐变量的分布之间的第二距离负相关。2.根据权利要求1所述的信息处理方法，其中，所述损失函数还包括使所述第二距离与所述第一距离之间的差值大于预定阈值的约束。3.根据权利要求2所述的信息处理方法，其中，所述损失函数还包括有关监督误差的约束，所述监督误差是基于所述语义特征的标签和图像的所述隐变量的分布而计算的。4.根据权利要求3所述的信息处理方法，其中，计算所述监督误差包括：使用非线性函数将图像的所述隐变量的分布映射到类别空间从而得到映射输出；以及使用分类损失函数或回归损失函数，根据所述映射输出和所述语义特征的标签来计算所述监督误差。5.根据权利要求3所述的信息处理方法，其中，图像的所述隐变量的先验分布包括任意分布。6.根据权利要求5所述的信息处理方法，其中，图像的所述隐变量的先验分布是通过以下方式获得的：根据所述隐变量的分布得到符合高斯分布的中间变量；以及对所述中间变量进行非线性变换，得到所述隐变量的先验分布。7.根据权利要求6所述的信息处理方法，其中，所述损失函数还包括有关所...

【专利技术属性】
技术研发人员：沈伟，刘汝杰，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人