一种半监督多视角数据集在线学习模型及其设计方法技术

技术编号：23892591 阅读：28 留言：0更新日期：2020-04-22 07:05

本发明专利技术公开了一种半监督多视角数据集在线学习模型及其设计方法，该模型包括：依次相连的多视角数据收集模块、缺失样本信息修复模块、有效样本信息增强模块及在线学习模型修正模块；所述在线学习模型修正模块用于对某一时间段中信息获得修复和增强后的样本，将其在所有视角下的特征根据前后时间段的对比，并划分为下一时间段被保留的特征、下一时间段被丢弃的特征和当前时间段新增的特征三部分；针对所划分的三部分特征建立实时优化函数，并进行求解和优化权向量；对下一时间段的保留特征做融合处理，从而得到相应的融合形式。将本发明专利技术应用于港口等领域中，能够有效提升在实际场景中处理实时产生的具有可变特征的半监督多视角数据集的能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种半监督多视角数据集在线学习模型及其设计方法
本专利技术涉及多视角学习
，具体涉及一种半监督多视角数据集在线学习模型及其设计方法。
技术介绍
在全面打造“智慧城市”的过程中，人们需要处理的数据集往往具有多种表现形式或来源。这类数据集被称为多视角数据集，一种表现形式或来源就是一个视角(如网页数据集中的文本、图像、视频)，而任一视角中所包含的不同种类的信息则被称为特征(如文本视角中的文本颜色、文本大小、文本粗细)。不同于表现形式或来源单一的单视角数据集，由于多视角数据集本身结构相对复杂，所以处理难度更高，一般需要通过基于该类数据集而提出的多视角分类器来解决。另外，就多视角数据集的特征而言，还进一步分为全局特征和局部特征。前者也被称为粗粒度特征，主要用于模糊匹配并描述主要特征信息，如轮廓、颜色等整体信息；后者又被称为细粒度特征，主要用于精细匹配并描述细节信息，如集装箱某一位置的特殊标记、特殊生物对应的光谱谱图上的某处信息等。由于局部特征对样本之间的微小差异更敏感，所以当前多视角分类器在设计时会更多的考虑局部特征。然而，在海关、港口、交通等领域中，受限于采样技术、人力成本、存储容量等客观因素，会造成处理的多视角数据集呈现特殊化，具体表现为：(1)视角或特征信息缺失：由于采样技术的限制，人们在采集多视角数据集时，会因人为疏忽或采集设备的故障，导致部分采集到的样本在某些视角或特征上信息不全，从而可能导致数据集缺失部分对分类器设计具有重要作用的视角或特征信息。举例而言，用四个摄像头对一个物体进行持续性拍摄并记录下颜...

【技术保护点】
1.一种半监督多视角数据集在线学习模型，其特征在于，包括依次相连的多视角数据收集模块、缺失样本信息修复模块、有效样本信息增强模块及在线学习模型修正模块；/n所述多视角数据收集模块用于对收集的多视角数据集进行区域定位和标记处理，并进行存储；/n所述缺失样本信息修复模块用于针对多视角数据集的每个视角所对应的样本矩阵，计算样本矩阵所对应的低秩假设矩阵并建立该视角所对应的子分类器；将低秩假设矩阵分解为样本矩阵的潜在表示形式和系数矩阵并更新子分类器；进而得到用于反映修复信息数量的量表达式和用于反映修复信息的分类性能的质表达式；基于量表达式和质表达式构建量质平衡模型，进而建立优化函数并对该函数进行求解，得到各个视角的潜在表示形式和系数矩阵的优化结果，通过两者相乘得到信息修复后的多视角数据集；/n所述有效样本信息增强模块用于针对修复后的多视角数据集，采用多视角聚类算法以获得视角和特征的权重；计算任一选择的一个有标签样本和一个无标签样本之间的相似度；根据计算出的相似度和一个选择标准，选择合适的相似度所对应的有标签样本和无标签样本，并生成合适的Universum样本，从而增强有效的样本信息；/n所述在线...

【技术特征摘要】
1.一种半监督多视角数据集在线学习模型，其特征在于，包括依次相连的多视角数据收集模块、缺失样本信息修复模块、有效样本信息增强模块及在线学习模型修正模块；
所述多视角数据收集模块用于对收集的多视角数据集进行区域定位和标记处理，并进行存储；
所述缺失样本信息修复模块用于针对多视角数据集的每个视角所对应的样本矩阵，计算样本矩阵所对应的低秩假设矩阵并建立该视角所对应的子分类器；将低秩假设矩阵分解为样本矩阵的潜在表示形式和系数矩阵并更新子分类器；进而得到用于反映修复信息数量的量表达式和用于反映修复信息的分类性能的质表达式；基于量表达式和质表达式构建量质平衡模型，进而建立优化函数并对该函数进行求解，得到各个视角的潜在表示形式和系数矩阵的优化结果，通过两者相乘得到信息修复后的多视角数据集；
所述有效样本信息增强模块用于针对修复后的多视角数据集，采用多视角聚类算法以获得视角和特征的权重；计算任一选择的一个有标签样本和一个无标签样本之间的相似度；根据计算出的相似度和一个选择标准，选择合适的相似度所对应的有标签样本和无标签样本，并生成合适的Universum样本，从而增强有效的样本信息；
所述在线学习模型修正模块用于对某一时间段中信息获得修复和增强后的样本，将其在所有视角下的特征根据前后时间段的对比，并划分为下一时间段被保留的特征、下一时间段被丢弃的特征和当前时间段新增的特征三部分；针对所划分的三部分特征建立实时优化函数，并进行求解和优化权向量；对下一时间段的保留特征做融合处理，从而得到相应的融合形式。

2.如权利要求1所述的半监督多视角数据集在线学习模型，其特征在于，所述多视角数据收集模块包括：
图像自动定位和标记子模块，用于对收集的多视角数据集进行区域定位和标记处理；
数据库存储子模块，与所述图像自动定位和标记子模块相连，用于存储处理后的多视角数据集。

3.如权利要求1所述的半监督多视角数据集在线学习模型，其特征在于，所述缺失样本信息修复模块包括：
量计算子模块，用于根据多视角数据集所对应的低秩假设矩阵的表达式，计算得到用于反映修复信息数量的量表达式；
质计算子模块，用于根据多视角数据集的每个视角下的特征所建立的视角的子分类器，计算得到用于反映修复信息的分类性能的质表达式；
信息修复子模块，用于对基于量表达式和质表达式构建的量质平衡模型建立优化函数并对该函数进行求解，得到各个视角的潜在表示形式和系数矩阵的优化结果，通过两者相乘得到信息修复后的多视角数据集。

4.如权利要求1所述的半监督多视角数据集在线学习模型，其特征在于，所述有效样本信息增强模块包括：...

【专利技术属性】
技术研发人员：朱昌明，
申请(专利权)人：上海海事大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人