一种基于高斯混合分布VAE的广义零样本识别方法技术

技术编号：24251575 阅读：34 留言：0更新日期：2020-05-22 23:35

本发明专利技术涉及一种基于高斯混合分布VAE的广义零样本识别方法，该方法包括以下步骤：步骤1：预训练res101网络后，经过该网络对样本图片特征提取并转化得到视觉特征；步骤2：针对样本图片的文本信息通过标注和设定得到语意特征；步骤3：建立分别用于处理视觉特征和语意特征的两种VAE模型，并进一步构建混合高斯分布VAE网络模型；步骤4：利用混合高斯分布VAE网络模型进行训练，分别将两类特征映射到对应的隐藏空间，并服从混合高斯分布，完成模型训练；步骤5：利用训练完成模型对实际待测试的特征进行分类，经过验证测试得到识别结果。与现有技术相比，本发明专利技术具有识别准确度高，识别速度快等优点。

A generalized zero sample recognition method based on VAE of Gaussian mixture distribution

全部详细技术资料下载

【技术实现步骤摘要】
一种基于高斯混合分布VAE的广义零样本识别方法
本专利技术涉及一种广义零样本识别方法，尤其是涉及一种基于高斯混合分布VAE的广义零样本识别方法。
技术介绍
近几年来，人工智能的热潮席卷世界，并且取得了很多优秀和标志性的成果。然而，人工智能的发展不得不依赖于庞大的数据库。在人工智能的计算中，数据库质量的重要性有时甚至超越了算法本身的重要性。当前，数据库存在一个很大的问题就是：样本的更新，如何能让计算机在满足识别旧的样本的同时，又识别出新的样本，成为一项具有挑战又十分具有研究意义的一项课题和任务。为了解决上述问题，人们开始着手零样本学习。所谓零样本学习，就是识别出训练集中不存在的类别。例如：为了识别猫、狗和猪，就需要提供大量的猫、狗和猪的图片用以模型训练，然后给定一张新的图片，就能判定属于猫、狗或猪的其中哪一类。但是对于之前训练图片未出现的类别牛、老虎等，这个模型便无法将牛、老虎识别出来。在过去的十几年中，人们开始着手零样本学习，主要工作包括课题的基本定义、算法性能的评估，算法的改进和创新。但是，之前绝大多数零样本学习的算法都是只测试新的类别，对于旧的类别没有一个较确切的评估，即测试时，不测试旧的类别猫、狗、猪，只测试新的类别牛、老虎。这并不符合现实生活中新旧类别同时检测的情景。因而，人们进一步提出了广义零样本学习这一更具有现实意义的概念，即在测试时加入了旧的类别的评估，将猫、狗、猪、牛和老虎放在一起进行测试。零样本学习的主要方法是视觉特征和语意特征的联系，广义零样本学习在之前研究工作的基础上，也形成了三...

【技术保护点】
1.一种基于高斯混合分布VAE的广义零样本识别方法，其特征在于，该方法包括以下步骤：/n步骤1：预训练res101网络后，经过该网络对样本图片特征提取并转化得到视觉特征；/n步骤2：针对样本图片的文本信息通过标注和设定得到语意特征；/n步骤3：建立分别用于处理视觉特征和语意特征的两种VAE模型，并进一步构建混合高斯分布VAE网络模型；/n步骤4：利用混合高斯分布VAE网络模型进行训练，分别将两类特征映射到对应的隐藏空间，并服从混合高斯分布，完成模型训练；/n步骤5：利用训练完成模型对实际待测试的特征进行分类，经过验证测试得到识别结果。/n

【技术特征摘要】
1.一种基于高斯混合分布VAE的广义零样本识别方法，其特征在于，该方法包括以下步骤：
步骤1：预训练res101网络后，经过该网络对样本图片特征提取并转化得到视觉特征；
步骤2：针对样本图片的文本信息通过标注和设定得到语意特征；
步骤3：建立分别用于处理视觉特征和语意特征的两种VAE模型，并进一步构建混合高斯分布VAE网络模型；
步骤4：利用混合高斯分布VAE网络模型进行训练，分别将两类特征映射到对应的隐藏空间，并服从混合高斯分布，完成模型训练；
步骤5：利用训练完成模型对实际待测试的特征进行分类，经过验证测试得到识别结果。

2.根据权利要求1所述的一种基于高斯混合分布VAE的广义零样本识别方法，其特征在于，所述的步骤1具体包括：采用经过Imagenet训练的res101网络针对样本图片进行特征提取并转化得到视觉特征。

3.根据权利要求1所述的一种基于高斯混合分布VAE的广义零样本识别方法，其特征在于，所述的步骤2具体包括：针对样本图片的文本信息，通过标注转换为文字向量后，再通过数字信息设定转换得到向量形式的语意特征。

4.根据权利要求1所述的一种基于高斯混合分布VAE的广义零样本识别方法，其特征在于，所述的步骤3中的混合高斯分布VAE网络模型包括softmax层和与其分别连接的两个VAE模型，每个所述VAE模型包括通过连接层相互连接的编码器、隐藏空间和解码器。

5.根据权利要求4所述的一种基于高斯混合分布VAE的广义零样本识别方法，其特征在于，所述的编码器包括多个注意力权重层、用于表示高斯分布方差和均值的多个Σ层和多个μ层。

【专利技术属性】
技术研发人员：邵洁，李晓瑞，
申请(专利权)人：上海电力大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人