The invention discloses a multi view classifier based on information enhancement and a design method thereof. The multi view classifier includes a multi view data collection module, a missing sample information repair module and an effective sample information enhancement module connected in turn. The invention can effectively improve the classification performance of multi view data sets in the actual scene by two aspects of missing sample information repair, effective sample information enhancement, etc. under the function of relevant interface, used in the field of ports, etc.
【技术实现步骤摘要】
一种基于信息增强的多视角分类器及其设计方法
本专利技术涉及多视角学习
,具体涉及一种基于信息增强的多视角分类器及其设计方法。
技术介绍
在全面打造“智慧城市”的过程中,人们需要处理的数据集往往具有多种表现形式或来源。这类数据集被称为多视角数据集,一种表现形式或来源就是一个视角(如网页数据集中的文本、图像、视频),而任一视角中所包含的不同种类的信息则被称为特征(如文本视角中的文本颜色、文本大小、文本粗细)。不同于表现形式或来源单一的单视角数据集,由于多视角数据集本身结构相对复杂,所以处理难度更高,一般需要通过基于该类数据集而提出的多视角分类器来解决。另外,就多视角数据集的特征而言,还进一步分为全局特征和局部特征。前者也被称为粗粒度特征,主要用于模糊匹配并描述主要特征信息,如轮廓、颜色等整体信息;后者又被称为细粒度特征,主要用于精细匹配并描述细节信息,如集装箱某一位置的特殊标记、特殊生物对应的光谱谱图上的某处信息等。由于局部特征对样本之间的微小差异更敏感,所以当前多视角分类器在设计时会更多的考虑局部特征。然而,在海关、港口、交通等领域中,受限于采样技术、人力成本等客观因素,会造成处理的多视角数据集呈现特殊化,具体表现为:(1)视角或特征信息缺失:由于采样技术的限制,人们在采集多视角数据集时,会因人为疏忽或采集设备的故障,导致部分采集到的样本在某些视角或特征上信息不全,从而可能导致数据集缺失部分对分类器设计具有重要作用的视角或特征信息。举例而言,用四个摄像头对一个物体进行持续性拍摄并记录下颜色、大小、轮廓等特 ...
【技术保护点】
1.一种基于信息增强的多视角分类器,其特征在于,包括依次相连的多视角数据收集模块、缺失样本信息修复模块以及有效样本信息增强模块;/n所述多视角数据收集模块用于对收集的多视角数据集进行区域定位和标记处理,并进行存储;/n所述缺失样本信息修复模块用于针对多视角数据集的每个视角所对应的样本矩阵,计算样本矩阵所对应的低秩假设矩阵并建立该视角所对应的子分类器;将低秩假设矩阵分解为样本矩阵的潜在表示形式和系数矩阵并更新子分类器;进而得到用于反映修复信息数量的量表达式和用于反映修复信息的分类性能的质表达式;基于量表达式和质表达式构建量质平衡模型,进而建立优化函数并对该函数进行求解,得到各个视角的潜在表示形式和系数矩阵的优化结果,通过两者相乘得到信息修复后的多视角数据集;/n所述有效样本信息增强模块用于针对修复后的多视角数据集,采用多视角聚类算法以获得视角和特征的权重;计算任一选择的一个有标签样本和一个无标签样本之间的相似度;根据计算出的相似度和一个选择标准,选择合适的相似度所对应的有标签样本和无标签样本,并生成合适的Universum样本,从而增强有效的用于多视角分类器训练的样本信息。/n
【技术特征摘要】
1.一种基于信息增强的多视角分类器,其特征在于,包括依次相连的多视角数据收集模块、缺失样本信息修复模块以及有效样本信息增强模块;
所述多视角数据收集模块用于对收集的多视角数据集进行区域定位和标记处理,并进行存储;
所述缺失样本信息修复模块用于针对多视角数据集的每个视角所对应的样本矩阵,计算样本矩阵所对应的低秩假设矩阵并建立该视角所对应的子分类器;将低秩假设矩阵分解为样本矩阵的潜在表示形式和系数矩阵并更新子分类器;进而得到用于反映修复信息数量的量表达式和用于反映修复信息的分类性能的质表达式;基于量表达式和质表达式构建量质平衡模型,进而建立优化函数并对该函数进行求解,得到各个视角的潜在表示形式和系数矩阵的优化结果,通过两者相乘得到信息修复后的多视角数据集;
所述有效样本信息增强模块用于针对修复后的多视角数据集,采用多视角聚类算法以获得视角和特征的权重;计算任一选择的一个有标签样本和一个无标签样本之间的相似度;根据计算出的相似度和一个选择标准,选择合适的相似度所对应的有标签样本和无标签样本,并生成合适的Universum样本,从而增强有效的用于多视角分类器训练的样本信息。
2.如权利要求1所述的基于信息增强的多视角分类器,其特征在于,所述多视角数据收集模块包括:
图像自动定位和标记子模块,用于对收集的多视角数据集进行区域定位和标记处理;
数据库存储子模块,与所述图像自动定位和标记子模块相连,用于存储处理后的多视角数据集。
3.如权利要求1所述的基于信息增强的多视角分类器,其特征在于,所述缺失样本信息修复模块包括:
量计算子模块,用于根据多视角数据集所对应的低秩假设矩阵的表达式,计算得到用于反映修复信息数量的量表达式;
质计算子模块,用于根据多视角数据集的每个视角下的特征所建立的视角的子分类器,计算得到用于反映修复信息的分类性能的质表达式;
信息修复子模块,用于对基于量表达式和质表达式构建的量质平衡模型建立优化函数并对...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。