用于预测图像样本的属性的方法和设备技术

技术编号:17144442 阅读:65 留言:0更新日期:2018-01-27 16:40
本申请涉及用于预测图像样本的属性的方法和系统。用于预测图像样本的属性的方法包括:从包括多个训练图像样本的训练集获得多个图像子集;逐渐地分裂每个图像子集以生成用于预测的决策森林;确定测试图像样本在所述决策森林中的节点的路径;合并所确定的每个路径中的所有叶节点处的训练图像样本;对所有已合并的训练图像样本进行聚类以获得重叠簇,每个已合并的训练图像样本被聚类成重叠簇中的至少一个;以及从重叠簇预测所述测试图像样本的属性。

Methods and devices used to predict the attributes of image samples

The present application relates to a method and system for predicting the attributes of an image sample. For the sample image attribute prediction method including: obtaining multiple images from a subset of the training image includes a plurality of samples of the training set; gradually split each image subset to generate predictive decision for forest; determine the path node test image samples in the decision-making in the forest; the training image samples of all leaf nodes at each path with the in; to cluster all merged training image samples to obtain overlapping clusters, each training image samples have been combined into overlapping clusters by clustering in at least one; and the attribute from the test image overlapping cluster prediction samples.

【技术实现步骤摘要】
【国外来华专利技术】用于预测图像样本的属性的方法和设备
本申请涉及机器学习,且特定地涉及用于预测图像样本的属性的方法和设备。
技术介绍
在许多视觉任务中存在数据不平衡的现象,从低层次的边缘检测到高层次的人脸年龄估计和头部姿势估计等不一而足。在广泛使用的FG-NET和MORPH数据库中,年轻的图像常常比年老的图像多得多,人体头部很少表现出极端的姿势,并且在BSDS500数据库上各种图像边缘图像数据结构服从幂律分布(power-lawdistribution)。如果不处理该不平衡的问题,则会导致常规视觉算法对多数类有很强的学习偏向而对少数类有较差的预测准确性,并且兴趣度通常相等或更大(例如,很少有边缘可传递关于自然图像的最重要的语义信息)。对少数类学习不足应归于由于示例的数目有限或甚至没有示例造成的完全缺乏表示,尤其是在存在小数据集的情况下。例如,FG-NET和Pointing’04头部姿势数据集总共仅分别具有1002和2790个图像(8个图像具有60+年龄且60个图像具有俯仰角90°);并且FG-NET没有针对60以上的某些年龄级的图像。这会给从通常具有较高可变性的少数类样本推断不可见(unseen)数据本文档来自技高网...
用于预测图像样本的属性的方法和设备

【技术保护点】
一种用于预测图像样本的属性的方法,包括:从包括多个训练图像样本的训练集获得多个图像子集;逐渐地分裂每个所述图像子集以生成用于预测的决策森林;确定测试图像样本在所述决策森林中的节点的路径;合并所确定的每个路径中的所有叶节点处的训练图像样本;对所有已合并的训练图像样本进行聚类以获得重叠簇,每个已合并的训练图像样本被聚类成所述重叠簇中的至少一个;以及从所述重叠簇预测所述测试图像样本的属性。

【技术特征摘要】
【国外来华专利技术】1.一种用于预测图像样本的属性的方法,包括:从包括多个训练图像样本的训练集获得多个图像子集;逐渐地分裂每个所述图像子集以生成用于预测的决策森林;确定测试图像样本在所述决策森林中的节点的路径;合并所确定的每个路径中的所有叶节点处的训练图像样本;对所有已合并的训练图像样本进行聚类以获得重叠簇,每个已合并的训练图像样本被聚类成所述重叠簇中的至少一个;以及从所述重叠簇预测所述测试图像样本的属性。2.根据权利要求1所述的方法,其中,所述分裂包括:将所述训练图像样本聚类成所述决策森林的每个节点处的不同类;为经过聚类后的类分配权重,其中给具有更少训练图像样本的类分配更大的权重,而给具有更多训练图像样本的类分配更小的权重;以及基于所分配的权重来分裂所述训练图像样本。3.根据权利要求2所述的方法,其中所述决策森林具有的深度能够使得每个所述类的所有训练图像样本具有相同属性。4.根据权利要求2所述的方法,其中所述决策森林的信息增益低于固定阈值。5.根据权利要求1所述的方法,其中在所述决策森林的所述叶节点处的训练图像样本具有低于固定阈值的大小。6.根据权利要求2所述的方法,其中,所述分裂包括:通过用于分类的代价敏感线性支持向量机来分裂所述训练图像样本。7.根据权利要求2所述的方法,其中,所述分裂包括:通过用于回归的代价敏感线性支持向量回归来分裂所述训练图像样本。8.根据权利要求1所述的方法,其中所述聚类包括:计算已合并的训练图像样本中的两个样本之间的偏置点间距离;以及基于所述偏置点间距离将已合并的每个所述训练图像样本分配给至少一个簇以获得所述重叠簇,其中,如果已合并的所述训练图像样本中的所述两个样本具有相同属性,则所述偏置点间距离是已合并的所述训练图像样本中的所述两个样本的欧几里德距离乘以等于或大于1的因数,否则所述偏置点间距离是所述欧几里德距离乘以小于1的因数。9.根据权利要求1所述的方法,其中所述预测包括:发现所述重叠簇中近似所述测试图像样本的簇;从所发现的簇计算所述测试图像样本的系数估计值;经由类近邻近似来更新所述系数估计值;使用所更新的系数估计值来预测所述测试图像样本的所述属性。10.一种用于预测图像样本的属性的系统,其包括:分裂装置,其用于从包括多个训练图像样本的训练集获得多个图像子集、并逐渐地分裂每个所述图像子集以生成用于预测的决策森林;确定装置,其与所述分裂装置电连接,并且用于确定测试图像样本在所述决策森林中的节点的路径;聚类装置,其与所述确定装置电连接,并且用于合并所确定的每个路径中的所有叶节点处的训练样本、并对所有已合并的训练样本进行局部聚类以获得重叠簇,所述重叠簇中的每一个具有至少两个属性;以及预测装置,其与所述聚类装置电连接,并且用于从所述重叠簇预测所述测试样本的属性。11.根据权利要求10所述的系统,其中所述分裂装置进一步包括:聚类单元,其将所述训练图像样本聚类成所述决策森林的每个节点处的不同类;第一分配单元,其与所述聚类单元电连接,并且为经过聚类后的类分配权重,其中更大的权重被分配给具有更少训练图像样本的类,而更小的权重被分配给具有更多训练图像样本的所述类;以及分裂单元,其与所述分配单元电连接,并且基于所分配的权重来分裂所述训练图像样本。12.根据权利要求11所述的系统...

【专利技术属性】
技术研发人员:汤晓鸥黄琛吕健勤
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1