当前位置: 首页 > 专利查询>摩福公司专利>正文

改进的数据比较方法技术

技术编号:13278256 阅读:71 留言:0更新日期:2016-05-19 03:00
本发明专利技术涉及一种对从传感器或接口得到的两个数据进行比较的方法,该方法由处理单元的处理装置实现,该方法包括计算待比较的两个特征向量之间的相似度函数,其特征在于,数据的每个特征向量被建模为高斯变量求和,所述高斯变量包括:向量所属的类的平均值,固有偏差,以及向量的观测噪声,每个特征向量与一个质量向量相关联,该质量向量包括特征向量的观测噪声的信息,并且在于,根据特征向量和相关联的质量向量来计算相似度函数。

【技术实现步骤摘要】

本专利技术涉及一种对从传感器或接口得到的数据进行比较以确定数据之间的相似 率的方法。本专利技术尤其涉及一种通过机器学习的数据比较方法。
技术介绍
在计算机视觉(或数字视觉)领域实现的众多任务例如要求对诸如图像之类的复 杂数据进行比较以得到该数据之间的相似度分数。 例如,在生物计量认证领域,对个体的面部图像进行比较以确定图像是否是从同 一人处得到的。 为了解决这类问题,已知从待比较的数据中提取特征,特征提取将待比较的数据 转换为特征向量,并随后计算特征向量之间的相似度函数。 计算出的相似度函数通常包括预先未知的参数。这些参数被确定并通过机器学习 来逐步优化。为此,处理单元对从数据库中得到的一组数据进行数据比较操作,将由相似度 函数给出的结果与实际结果进行比较,并且相应地优化相似度函数的参数以得到更加可靠 的结果。 例如,根据D·Chen,X·Cao,L·Wang,F·Wen和J·Sun在2012年的ECCV(European Conference on Computer Vision,欧洲计算机视觉国际会议)上发表的《Bayesian Face Revisited:AJoint Formulation》(贝叶斯面部重历:联合公式化),数据之间的相似度函数 的学习方法是已知的,其中,通过对两个独立的高斯变量求和对数据建模:一个数据所属的 类(class)的平均值以及该数据相对于平均值的变化。 例如,如果数据为面部图像,则类对应于主体的身份,并且相对于类的平均值的变 化对应于主体的平均面部图像与不同环境下拍摄的图像之间可能存在的全部改变: -图像上的光和影, -图像中的面部姿态, -面部表情, -局部模糊等。 然而,在数据库中将数据的质量变化考虑在内限制了机器学习所形成的比较性能 水平的提升。其结果是,所确定的相似度函数表现出欠佳的性能并因此表现出欠佳的比较 质量。所提出的比较方法因而并不完全可靠。
技术实现思路
本专利技术的目的是提出一种数据比较方法,该数据比较方法相比于现有技术具有改 进的性能。 在此方面,本专利技术的主题是由处理单元的处理装置实现对从传感器或接口得到的 两个计算机数据项目进行比较的方法,该方法包括计算待比较的两个特征向量之间的相似 度函数, 其特征在于,对高斯变量求和来对一个数据的各特征向量建模,所述变量包括: -向量所属的类的平均值, -固有偏差,以及, -向量的观测噪声,每个特征向量与一个质量向量相关联,该质量向量包括特征向量的观测噪声的信 息,并且在于,根据特征向量和相关联的质量向量来计算相似度函数。有利但可选地,本专利技术的方法还可以包括以下特征中的至少一个: -相似度函数是具有属于同一类的向量的特征向量的概率密度与与具有两个不同类的向量的特征向量的概率密度之间的比率的对数。 -相似度函数还根据特征向量的分量的协方差矩阵来计算,并且每个特征向量的 观测噪声的协方差矩阵根据相关联的质量向量来得到。 -该方法还包括实现学习算法来确定向量所属的类的平均值和相对于类平均值的 向量偏差的协方差矩阵。-学习算法为期望最大算法;-相似度函数由下式给出:并且其中,Su为所述类的平均值的协方差矩阵(类间协方差矩阵),SU为相对于平 均值的偏差的协方差矩阵(类内协方差矩阵),并且SEX和SEy分别为所述向量X和y的所述观 测噪声的协方差矩阵;-来此传感器或接口的计算机数据是表示物理对象或物理量的数据;-来自传感器或接口的计算机数据是图像,并且通过对图像应用至少一个滤波器 得到特征向量; -质量向量的分量根据数据类型和形成特征向量的特征类型来生成; -该方法还包括将所计算的相似度函数的结果与阈值进行比较,从而确定数据是 否属于公共类。本专利技术的另一主题是一种包括代码指令的计算机程序产品,该代码指令在被处理 单元的处理装置执行时实现之前描述的方法。本专利技术的另一主题是一种系统,包括:-数据库,包括多个所谓的标签数据;-数据采集单元;以及-处理单元,该处理单元包括处理装置,该处理单元适用于根据两个数据项来构造 两个特征向量和两个相关联的质量向量,所述处理单元还适用于通过实现之前描述的方法 来比较数据。 所提出的方法使得能够在计算数据之间的相似度函数的同时考虑到数据质量。这 使得有可能在质量良好的数据与不确定性更大的数据之间使用可变的权重。 例如,当本专利技术的方法被应用于图像比较时,相似度函数对于图像的阴影或模糊 区域并未被相似度函数的考虑权重并不如清晰可见、清楚辨别的区域那样大。 数据比较性能借此得到了增强。 另外,机器学习使得能够优化相似度函数参数并因此提升比较方法的性能。【附图说明】 根据以下仅以解释为目的的非限定性说明并且结合附图,本专利技术的其他特点、目 的和优点将变得明显,在附图中: -图1示出了适用于实现比较方法的系统的一个示例; -图2示出了根据本专利技术的一个实施例的数据比较方法的主要步骤。【具体实施方式】 参考图1,所示系统1包括处理单元10,处理单元10包括处理装置11以实现下述计 算机数据比较方法。 处理单元10例如可以是集成电路并且处理装置可以是处理器。 有利地,系统1还包括可选远程数据库20,远程数据库20在存储器中存储了多个数 据,这些数据被处理单元10使用以实现下述机器学习。 最后,系统1包括数据采集单元30,或者当数据采集单元30独立于系统时,系统包 括适用于与此单元进行通信的接口(未示出)。以此方式,系统1能够接收并处理数据b,尤其 是使用下述方法对数据b进行比较。 根据在下述方法中待比较的数据类型的不同,数据采集单元可以是任何类型的, 例如,光学传感器(照相机、摄像机、扫描仪)、声学传感器、指纹传感器、运动传感器等等。数 据采集单元还可以是人机接口(键盘、具有触屏接口的平板电脑)以记录操作人员输入的诸 如文本、图片等数据。计算机数据b由采集单元30得到并因而来自传感器或者例如人机接口这样的接 口。计算机数据b可以是代表物理对象(例如图像、示意图、记录、说明)或者代表(电、机械、 热、声等)物理量的数据,例如,由传感器记录的数据。处理单元的处理装置11有利地被配置为通过执行合适的程序来实现下述数据比 较方法。为了实现本方法,处理装置11有利地还包括特征提取模块12,特征提取模块12适 用于根据由数据采集单元30传送的输入计算机数据b进行特征提取,以便生成与数据相关 联的特征向量X以及与特征向量相关联的质量向量qx。质量向量qx与特征向量的大小相同,并且质量向量qx中的每个元素表明特征向量 X的对应元素中包含的信息的质量。替代性地,质量向量qx可以是任意大小的。质量向量qx 的生成取决于数据b的类型。 例如,通过将用于此用途的一个或更多滤波器应用于数据b,可选地随后对滤波结 果(例如,计算出的直方图等)进行处理,能够实现特征提取。 质量向量的生成依赖于数据b的类当前第1页1 2 3 本文档来自技高网
...

【技术保护点】
一种对从传感器或接口(30)得到的两个数据进行比较的方法,该方法由处理单元(10)的处理装置(11)实现,所述方法包括计算(100)待比较的数据的两个特征向量(x、y)之间的相似度函数,其特征在于,数据的每个特征向量被建模为三个独立的高斯变量求和μ+ω+ε,其中,所述高斯变量为:‑所述向量所属的类的平均值μ,‑固有偏差ω,以及‑所述向量的观测噪声ε,每个特征向量x与质量向量qx相关联,所述质量向量包括所述特征向量的所述观察噪声的信息,所述质量向量的分量根据数据类型和形成所述特征向量的特征类型来生成,并且在于,所述相似度函数根据所述特征向量(x、y)和相关联的质量向量(qx、qy)并依照所述特征向量的分量的协方差矩阵(Sμ、Sω、Sεx Sεy)来计算,并且每个特征向量的所述观测噪声的协方差矩阵(Sεx Sεy)根据相关联的质量向量来得到。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:J·博纳S·根特里克
申请(专利权)人:摩福公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1