基于自训练的零样本视频分类方法技术

技术编号：15640471 阅读：131 留言：0更新日期：2017-06-16 06:08

本发明专利技术涉及机器学习中的视频分类，为将训练视频的视觉特征和视频类别名称的语义特征映射到一个公共空间，对于新输入的测试视频，将它的视觉特征映射到公共空间，找到对应的语义特征，就可以确定测试视频的所属类别。为此，本发明专利技术，基于典型相关分析CCA和自训练的零样本视频分类方法，将训练视频的视觉特征和视频类别名称的语义特征映射到一个公共空间，在这个公共空间中，视频的视觉特征和相应的语义特征具有良好的对应关系，对于新输入的测试视频，将它的视觉特征映射到公共空间，找到对应的语义特征，确定测试视频的所属类别；其中，采用CCA和自训练的方法使得测试样本的映射分布于原型点周围。本发明专利技术主要应用于视频分类场合。

全部详细技术资料下载

【技术实现步骤摘要】
基于自训练的零样本视频分类方法
零样本视频分类涉及机器学习中的视频分类问题，具体讲,涉及基于自训练的零样本视频分类方法。
技术介绍
对于传统的视频分类系统，要想准确识别出某类视频，必须给出相应的带标签的训练数据。但训练数据的标签往往是难以获得的，零样本视频分类就是解决类别标签缺失问题的一种有效手段，其目的在于模仿人类无需看过实际视觉样例，就能认出新的类别的能力。传统的分类方法是将给定的数据集划分为训练集和测试集，用在训练集上学到的模型来识别测试集中的数据，其中训练集和测试集有着相同的类别数。与传统的方法不同的是，零样本视频分类是在没有训练样本的情况下识别新的类别，也就是说训练集和测试集在数据的类别上没有交集，如图1所示。零样本学习旨在通过已有的辅助信息(属性、类别名称等)来训练识别未知类别的分类器，因此可以认为零样本学习对未知类别的识别是建立在人类对类别的描述之上，而不是大量的训练数据。在零样本视频分类中，类别名称所组成的语义空间是最常用的辅助信息，对于未见过的类别的测试视频和其相应的类别名称，需要借助语义空间建立联系。在语义空间中，每一个类别名称都被表示成一个高维向量，这一高维向量又可被称为词向量(wordvector)。常用的词向量提取方法是Mikolov等人提出的word2vec，它是一种无监督的方法，可以将语料库中的单词用向量来表示，并且向量之间的相似度可以很好的模拟单词语义上的相似度。在给定的语义空间中求得已见过的和未见过的类别的语义特征向量后，各类别间的语义相关性就可以由语义特征向量之间的距离求出。然而，视频是由视觉空间中的视觉特征向量表示的，...
基于自训练的零样本视频分类方法

【技术保护点】
一种基于自训练的零样本视频分类方法，其特征是，将训练视频的视觉特征和视频类别名称的语义特征映射到一个公共空间，在这个公共空间中，视频的视觉特征和相应的语义特征具有良好的对应关系，对于新输入的测试视频，将它的视觉特征映射到公共空间，找到对应的语义特征，确定测试视频的所属类别；其中，采用CCA和自训练的方法使得测试样本的映射分布于原型点周围：首先在测试样本的映射点中寻找K个距离测试样本原型点

【技术特征摘要】
1.一种基于自训练的零样本视频分类方法，其特征是，将训练视频的视觉特征和视频类别名称的语义特征映射到一个公共空间，在这个公共空间中，视频的视觉特征和相应的语义特征具有良好的对应关系，对于新输入的测试视频，将它的视觉特征映射到公共空间，找到对应的语义特征，确定测试视频的所属类别；其中，采用CCA和自训练的方法使得测试样本的映射分布于原型点周围：首先在测试样本的映射点中寻找K个距离测试样本原型点最近的点，然后将这K个点求平均之后所得的点作为调整后的原型点，令表示原型点的K近邻集合，表示调整后的原型点，自训练的过程用如下公式表述：对于未见过的类别的测试数据，将其视觉特征x′映射到公共空间，得到然后，将所有未见过的类别的语义特征映射到公共空间，得到y'是测试数据的语义特征，m是测试数据的类别数，找出与相关性最大的对应的类别，从而得到测试数据的分类结果。2.如权利要求1所述...

【专利技术属性】
技术研发人员：郭威辰，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人