当前位置: 首页 > 专利查询>厦门大学专利>正文

一种基于偏好统计的数据表征的模型拟合方法技术

技术编号:21344280 阅读:88 留言:0更新日期:2019-06-13 22:45
一种基于偏好统计的数据表征的模型拟合方法,涉及计算机视觉技术。准备数据集;针对每个点xi,计算该点到M个模型假设的绝对残差;J‑Linkage的一致统计分析本质是统计所有的残差值中小于固定阈值的残差;基于非参的核密度估计技术,获得

A Model Fitting Method Based on Preference Statistics for Data Representation

A model fitting method based on preference statistics for data representation involves computer vision technology. Prepare data sets; Calculate absolute residuals of the point to M model assumptions for each point xi; J Linkage's consistent statistical analysis essentially counts all residuals less than a fixed threshold; Based on non-parametric kernel density estimation technology, obtain

【技术实现步骤摘要】
一种基于偏好统计的数据表征的模型拟合方法
本专利技术涉及计算机视觉技术,尤其是涉及一种基于偏好统计的数据表征的模型拟合方法。
技术介绍
视觉是人类从大自然中获取信息的最主要的手段之一。人类感知外界信息很大一部分是通过视觉得到,其它的由味觉,听觉等得到。由此可见视觉信息的重要性。随着计算机技术的不断发展,人们不仅希望计算机能够获取得图像信息,也希望计算机具有人类视觉的感知功能,使其高效地处理图像信息,因此计算机视觉这门新兴的综合学科得到广泛关注。在过去的十几年里计算机视觉取得了蓬勃的发展,并出现了大量的基于计算机视觉的产品。例如:具有人脸自动检测和全景拍摄功能的数码相机,具有美颜功能的手机、汽车的智能泊车功能、汽车无人驾驶等。对计算机视觉而言的一项重要任务是,如何让计算机从图像中获取人类所需要的信息。在大部分情况下,这些信息可以用参数模型来表示。所需要的这些参数模型可以通过,模型拟合方法从输入的数据中计算得到。因此,在很多计算机视觉的任务中,模型拟合具有重要的作用。在过去的几十年里,大量的模型拟合方法已经被提出来。随机抽样一致的方法RANSAC,由于其简单和高效而被广泛地应用,但是该方法初始的设计,只能处理单一结构的数据。为处理多结构数据,许多方法(例如J-Linage,RansaCov)已经被提出来,并且提高了拟合的性能。然而,这些方法的拟合精度对于内点噪声尺度非常地敏感。因此,取代类似于RANSAC采用基于一致统计分析的方法,RHA提出了偏好分析的方法。例如,J-Linage提出采用二值偏好的方式来表征数据点,其中二值偏好是通过一系列获选模型的一致分析获取的。为了更加精确地描述点的偏好,T-Linkage和RPA将二值偏好松弛为连续偏好来表征数据点。并且T-Linkage和RPA分别利用一个连续的指数核函数和一个连续的鲁棒柯西函数来表征连续的偏好分析。另外,KF提出根据点到生成的模型假设的升序的残差安排来表征每个数据点。基于偏好分析的数据表征的模型拟合方法,在更加充分的描述数据点时发挥了很大的优势。然后这些拟合方法运用了偏好信息,他们缺少了一致信息,这可能导致不好的拟合结果。
技术实现思路
本专利技术的目的在于提出一种基于偏好统计的数据表征的模型拟合方法。本专利技术包括以下步骤:1)准备数据集;在步骤1)中,所述准备数据集的具体方法可为:输入N个数据点X={xi}i=1,...,N,从输入的数据点中采样M个最小子集生成模型假设H={hj}j=1,...,M,其中一个最小子集是估计一个模型所需要的最小子集,当生成一条直线需要两个点时,估计一个基础矩阵需要7个点或者8个点。2)针对每个点xi,计算该点到M个模型假设的绝对残差(可用sampson距离度量);3)J-Linkage的一致统计分析本质是统计所有的残差值中小于固定阈值的残差,所述阈值由指定的或者估计的内点噪声尺度决定;一种非常粗糙的残差直方图数据表征,它将所有的小于阈值的残差归到一个直方图簇中和将大于阈值的残差归到另一个直方图簇中;提出将所有的残差值中小于固定阈值的残差,归到K个簇的残差直方图中进行残差数据表征,其中,K是一个相对小的整数>1,即,针对每个数据点xi,对该点关于每个假设的残差值进行排序,并且安排这些残差值到直方图的k个簇中,其中,k∈{1,...,K},因此,定义一个偏好统计矩阵其中θij是关于第i个点和第j个假设对应的直方图簇的索引值,这是一种更加清晰的数据表征方法,它将比J-Linkage的一致统计分析方法保留了更多的残差信息;4)基于非参的核密度估计技术,获得个有意义的模型假设得到一个修剪的偏好统计矩阵该矩阵只包含个有意义的模型假设5)分析矩阵中每一行的信息内容,然后将内点从离群点区分出来,其中每一行对应于第i数据点xi,每一行的信息内容和该行的数值(直方图的簇)情况密切相关,那么,每行的信息熵能够以簇值的概率分布进行测量,通过以下的熵度量:其中,r(r<K)是在第i行中所出现的簇值的数目,ait表示第i行中的第t个簇值出现的次数,以及p(ait)是第i行中第t个簇值的概率,p(ait)通过归一化数值ait在所有簇集中的值,计算如下:根据公式(1),能够在每一行获取不同的信息熵;因此,内点和离群点在偏好统计矩阵中将显示出很大的区别,通过一个自动熵阈值,能够移除大量的离群点在不同的值;6)根据保留下来的内点,分割数据到不同的数据结构里,提出一种新型的基于自适应聚类的模型选取算法,该算法能够自动学习数据相似矩阵并同时执行聚类来估计模型实例,能够有效地处理处于交叉模型实例附近的数据点。在步骤6)中,所述提出一种新型的基于自适应聚类的模型选取算法,该算法能够自动学习数据相似矩阵并同时执行聚类来估计模型实例,能够有效地处理处于交叉模型实例附近的数据点的具体步骤可为:采用cosine距离作为度量,决定每个点的最近邻居点,通过在偏好统计矩阵中对应的两个行向量和两个内点之间的cosine距离能够被计算如下:根据两两点之间的cosine构造相似矩阵,以及定义每个内点能够被其它所有内点成为邻居点的概率是sii′,其中sii′是对应于相似矩阵的每个元素;两个点之间越小的距离就可能有越大的概率成为邻边,因此sii′的值对应于两点和的距离值成反比,对于所有的内点,自适应邻边的模型可以通过以下公式(4)解决:式中,α是正则化参数,在谱分析中,Ls=D-(ST+S)/2被成为拉普拉斯矩阵,式中度矩阵被定义为一个对角矩阵,它的第i行元素是D=∑i′(sii′+si′i)/2;以一个接近的方式解决,优化方程公式(4)自适应安排每个点的领边,自适应学习的相似矩阵S经过合理地排序形成块对角;那么,基于学习的相似矩阵S就可以将内点划分到c个模型实例;其中c是结构数目。而初始化相似矩阵S的连接成分的数目c通过计算相似矩阵S对应的拉普拉斯矩阵的特征值小于一定阈值μ的数目;在实践中,一个模型实例可能对应于多个模型,这实际上是同一个模型的不完美估计;因此,将进一步精化拟合结果,通过合并两个具有相似偏好信息的独立模型;基于自适应图学习技术,所提出的方法能够有效地处理处于交叉模型实例附近的数据点。在步骤3)中,所述K=6。在步骤6)中,所述α=20,μ=0.06。本专利技术提出一种基于新型的数据表征,处理包含噪点和离群点的多结构数据的模型拟合方法。所提出的数据表征通过残差直方图簇的频次计算分析直方图的特性表征数据,其中残差是一个数据点关于生成的模型假设的残差。所提出的基于直方图分析的数据表征结合了一致统计和偏好分析的优点。接着,为了有效利用嵌入在所提出的数据表征的统计信息,一种简单的熵阈值方法被用来自适用地离群点去除。最后,基于自适应图学习技术(该技术能够处理在模型实例交叉附近处的数据点)提出一种有效的模型选取方法;并且结合结构限制自动地估计模型实例的数目。相比现有的模型拟合方法,所提出的拟合方法主要有以下三个贡献点:第一,提出一种新型的数据表征方法,基于残差直方图簇的频次计算分析。所提出的数据表征结合了一致统计和偏好分析的优点,提高了模型拟合的精度。第二,提出采用简单的信息熵阈值的算法进行自适用离群点去除,该做法充分利用了嵌入在所提出的数据表征的统计信息,使得该算法本文档来自技高网
...

【技术保护点】
1.一种基于偏好统计的数据表征的模型拟合方法,其特征在于包括以下步骤:1)准备数据集;2)针对每个点xi,计算该点到M个模型假设的绝对残差,用sampson距离度量;3)J‑Linkage的一致统计分析本质是统计所有的残差值中小于固定阈值的残差,所述阈值由指定的或者估计的内点噪声尺度决定;一种非常粗糙的残差直方图数据表征,它将所有的小于阈值的残差归到一个直方图簇中和将大于阈值的残差归到另一个直方图簇中;提出将所有的残差值中小于固定阈值的残差,归到K个簇的残差直方图中进行残差数据表征,其中,K是一个相对小的整数>1,即,针对每个数据点xi,对该点关于每个假设的残差值进行排序,并且安排这些残差值到直方图的k个簇中,其中,k∈{1,...,K},因此,定义一个偏好统计矩阵

【技术特征摘要】
1.一种基于偏好统计的数据表征的模型拟合方法,其特征在于包括以下步骤:1)准备数据集;2)针对每个点xi,计算该点到M个模型假设的绝对残差,用sampson距离度量;3)J-Linkage的一致统计分析本质是统计所有的残差值中小于固定阈值的残差,所述阈值由指定的或者估计的内点噪声尺度决定;一种非常粗糙的残差直方图数据表征,它将所有的小于阈值的残差归到一个直方图簇中和将大于阈值的残差归到另一个直方图簇中;提出将所有的残差值中小于固定阈值的残差,归到K个簇的残差直方图中进行残差数据表征,其中,K是一个相对小的整数>1,即,针对每个数据点xi,对该点关于每个假设的残差值进行排序,并且安排这些残差值到直方图的k个簇中,其中,k∈{1,...,K},因此,定义一个偏好统计矩阵其中θij是关于第i个点和第j个假设对应的直方图簇的索引值,这是一种更加清晰的数据表征方法,它将比J-Linkage的一致统计分析方法保留了更多的残差信息;4)基于非参的核密度估计技术,获得个有意义的模型假设得到一个修剪的偏好统计矩阵该矩阵只包含个有意义的模型假设5)分析矩阵中每一行的信息内容,然后将内点从离群点区分出来,其中每一行对应于第i数据点xi,每一行的信息内容和该行的数值情况密切相关,那么,每行的信息熵能够以簇值的概率分布进行测量,通过以下的熵度量:其中,r(r<K)是在第i行中所出现的簇值的数目,ait表示第i行中的第t个簇值出现的次数,以及p(ait)是第i行中第t个簇值的概率,p(ait)通过归一化数值ait在所有簇集中的值,计算如下:根据公式(1),能够在每一行获取不同的信息熵;因此,内点和离群点在偏好统计矩阵中将显示出很大的区别,通过一个自动熵阈值,能够移除大量的离群点在不同的值;6)根据保留下来的内点,分割数据到不同的数据结构里,提出一种基于自适应聚类的模型选取算法,该算法自动学习数据相似矩阵并同时执行聚类来估计模型实例,处理处于交叉模型实例附近的数据点。2.如权利要求1所述一种基于偏好统计的数据表征的...

【专利技术属性】
技术研发人员:王菡子郭翰林肖国宝严严
申请(专利权)人:厦门大学
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1