当前位置: 首页 > 专利查询>中山大学专利>正文

一种排序整合问题的求解方法技术

技术编号:17541618 阅读:53 留言:0更新日期:2018-03-24 18:39
本发明专利技术提供一种排序整合问题的求解方法,该方法是一种具有健壮性的排序整合方法,该排序整合方法同时考虑了排序列表存在缺失值和噪声的情况。本发明专利技术首先通过输入的排序列表构造一个成对比较矩阵,然后将该矩阵能够分解成一个低秩矩阵和一个偏移误差矩阵的和。且该偏移误差矩阵是由行稀疏矩阵与列稀疏矩阵组合成的。最后本发明专利技术将利用增广拉格朗日乘子法进行该形式的问题求解。

A method for solving the problem of sorting and integration

The invention provides a sorting and integration solution method, which is a robust sorting and integration method. The sorting and integration method takes into account the existence of missing values and noises in the sorting list. The invention first constructs a pair comparison matrix through the sorted list of input, and then decomposes the matrix into a sum of a low rank matrix and a deviation error matrix. The deviation matrix is composed of a row sparse matrix and a column sparse matrix. In the end, an augmented Lagrange multiplier method is used to solve the problem.

【技术实现步骤摘要】
一种排序整合问题的求解方法
本专利技术涉及数据挖掘与信息检索领域,更具体地,涉及一种排序整合问题的求解方法。
技术介绍
随着大数据时代的到来,数据挖掘技术也是越来越热门,越来越多的应用需要使用到数据挖掘技术。在许多应用场景中,比如百度、谷歌等搜索引擎的网页推荐排序,京东、阿里等电商平台的商品推荐,优酷、爱奇艺等视频网站的视频推荐,都需要使用到排序学习的技术。排序整合方法,即如何将多个有序列表整合成一个更好效果的有序列表的技术,在大数据时代背景下也变得越来越热门。排序整合在许多应用中都扮演着重要的角色,例如元搜索、协同过滤、机器翻译、对象分类等。排序整合方法主要可以分成两类。一类是基于分数的方法,适用于排序列表中的元素都拥有一个分数值的情况。另一类是基于顺序的方法,适用于只能使用排序列表中元素排列顺序的情况。在现实场景中,第二类方法更加普遍,因为分数信息相对于排列顺序信息的可靠性比较低,以及在绝大多数情况下,比如元搜索中,我们只能获取到排列顺序信息,并不能得到一个准确的分数。本专利提出的方法都是属于第二类的情况。基于顺序的排序整合方法中,具有代表性的现有方法有:BordaCount(Borda1781)、medianrankaggregation(Faginetal.2003)、MarkovChainbasedmethods(Dworketal.2001)、probabilisticrankaggregation(Qinetal.2010a)、matrixcompletionbasedrankaggregation(GleichandLim2011)等。在BordaCount中,每一个元素通过计算它在所有排序列表中的排序位置来得到一个新的排序。Medianrankaggregation则利用所有列表中的排序位置的中位数进行新的排序。MarkovChainbasedmethods通过利用输入列表的排列顺序去学习出一个马尔科夫链,然后利用这个马尔科夫链去进行新的排序。Probabilisticrankaggregation使用一个基于距离的概率模型生成一个新的排序。Matrixcompletionbasedrankaggregation通过利用输入列表中元素间的排列顺序关系来构造一个成对的比较矩阵,然后利用该矩阵生成一个秩为2的矩阵,然后利用该矩阵统计出每一个元素的得分值来排序。这些整合方法可以处理输入排序列表存在缺失值的情况,但是没有考虑输入排序列表出现噪声的情况。而在2012年,Yeetal.发表的RobustLateFusionwithRankMinimization论文中提出了处理噪声的方法,但是排序列表不能有缺失值。而本专利提出的方法既考虑了存在缺失值的情况,也考虑了存在噪声的情况。而目前专利库中没有关于排序整合相关的专利。
技术实现思路
本专利技术提供一种考虑了排序列表存在缺失值和噪声的情况的排序整合问题的求解方法。为了达到上述技术效果,本专利技术的技术方案如下:一种排序整合问题的求解方法,包括以下步骤:S1:将排序整合问题数学模型化;S2:将S1中得到的目标数学公式转成拉格朗日式子;S3:将拉格朗日式子利利用学习算法进行更更新参数求解。进一步地,所述步骤S1的具体过程如下:S11:给定m个元素以及n个独立的排序列表,用π(i)表示第i个独立排序列表,将π(i)转换成一个比较矩阵T(i),为矩阵的一个元素:S12:将矩阵T(i)进行分解,分解成一个正确的,不存在噪声的矩阵Z,和一个噪声矩阵N(i)W(i)⊙T(i)=W(i)⊙(Z+N(i))(1)其中⊙表示矩阵对应元素相乘操作,即可见排序整合的任务其实就是推导得到一个Z矩阵;S13:利用噪声矩阵的对称性,将噪声矩阵分解:W(i)⊙T(i)=W(i)⊙(Z+E(i)-(E(i))T)(2)其中,E(i)为列稀疏矩阵,W(i)为指标矩阵,W(i)与T(i)的大小一致,当时,否则W(i)为一个对称矩阵;S14:得到排序整合问题的数学公式化表达:其中,||Z||*表示所期望的矩阵Z的低秩结构,||E(i)||2,1为L2范数的形式,表示所期望的E(i)矩阵的稀疏程度,故求出Z矩阵的问题即转换成(3)式的数学形式;S15:将Z矩阵进行分解,得到一个新的数学公式化表达:其中,Ir为r*r的单位矩阵,令Z=QJ,为一个列正交的矩阵,||Z||*=||QJ||*=||J||*。进一步地,所述步骤S2的具体过程如下:S21:引入一个辅助矩阵变量F(i),F(i)=E(i),有:S22:利用增广拉格朗日乘子法,得到对应的拉格朗日式子:s.t.QQT=Ir其中X(i)、Y(i)和L是拉格朗日乘子。进一步地,所述步骤S3的具体过程如下:1)、输入λ,2)、Q,J,Z,L,E(i),F(i),X(i),Y(i)(i=1,2,3···n)初始化为元素为0的矩阵,μ=10-6,ρ=1.9,ε=10-8;3)、更新Q,Q=U1V1T,其中U1∑1V1为矩阵(Z+L/μ)JT的SVD分解形式;4)、更新J,其中U2∑2V2为矩阵QT(Z+L/μ)的SVD分解形式,S1/μ(X)=max(0,X+1/μ)+min(0,X-1/μ);5)、更新Z:其中,表示对应元素之间的除法,1m*m表示一个m*m元素值都为1的矩阵;6)、更新E(i):其中,K=F(i)+Y(i)/μ,K(:,j)和E(:,j)表示矩阵K和E的第J列;7)、更新F(i):其中,C的值如下:C=E(i)-Y(i)/μ+W(i)⊙[(T(i)-Z+X(i)/μ)-(T(i)-Z+X(i)/μ)T];8)、更新L:L←L+μ(Z-QJ);9)、更新X(i):X(i)←X(i)+μW(i)⊙(T(i)-|Z-F(i)|+F(i)|T);10)、更新Y(i):Y(i)←Y(i)+μ|(F(i|)-E(i));11)、更新μ:μ←min(ρμ,1010);12)、重复步骤3)-11),直到||Z-QJ||∞≤ε,||F(i)-E(i)||∞≤ε以及||W(i)⊙(T(i)-Z-F(i))+(F(i))T||∞≤ε;13)、输出Z,E(i)(i=1,2,3,···,n)。与现有技术相比,本专利技术技术方案的有益效果是:本专利技术方法提出一种具有健壮性的排序整合方法,该排序整合方法同时考虑了排序列表存在缺失值和噪声的情况。本专利首先通过输入的排序列表构造一个成对比较矩阵,然后将该矩阵能够分解成一个低秩矩阵和一个偏移误差矩阵的和。且该偏移误差矩阵是由行稀疏矩阵与列稀疏矩阵组合成的。最后本专利将利用增广拉格朗日乘子法进行该形式的问题求解。附图说明图1为本专利技术方法流程图;图2为N(i)其实可以表示成一个列稀疏矩阵与一个行稀疏矩阵的差示意图。具体实施方式附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本专利技术的技术方案做进一步的说明。实施例1如图1所示,一种排序整合问题的求解方法,包括以下步骤:S1:将排序整合问题数学模型化;S2:将S1中得到的目标数学公式转成拉格朗日式子;S本文档来自技高网
...
一种排序整合问题的求解方法

【技术保护点】
一种排序整合问题的求解方法,其特征在于,包括以下步骤:S1:将排序整合问题数学模型化;S2:将S1中得到的目标数学公式转成拉格朗日式子;S3:将拉格朗日式子利利用学习算法进行更更新参数求解。

【技术特征摘要】
1.一种排序整合问题的求解方法,其特征在于,包括以下步骤:S1:将排序整合问题数学模型化;S2:将S1中得到的目标数学公式转成拉格朗日式子;S3:将拉格朗日式子利利用学习算法进行更更新参数求解。2.根据权利要求1所述的排序整合问题的求解方法,其特征在于,所述步骤S1的具体过程如下:S11:给定m个元素以及n个独立的排序列表,用π(i)表示第i个独立排序列表,将π(i)转换成一个比较矩阵T(i),为矩阵的一个元素:S12:将矩阵T(i)进行分解,分解成一个正确的,不存在噪声的矩阵Z,和一个噪声矩阵N(i)W(i)⊙T(i)=W(i)⊙(Z+N(i))(1)其中⊙表示矩阵对应元素相乘操作,即可见排序整合的任务其实就是推导得到一个Z矩阵;S13:利用噪声矩阵的对称性,将噪声矩阵分解:W(i)⊙T(i)=W(i)⊙(Z+E(i)-(E(i))T)(2)其中,E(i)为列稀疏矩阵,W(i)为指标矩阵,W(i)与T(i)的大小一致,当时,否则W(i)为一个对称矩阵;S14:得到排序整合问题的数学公式化表达:其中,||Z||*表示所期望的矩阵Z的低秩结构,||E(i)||2,1为L2范数的形式,表示所期望的E(i)矩阵的稀疏程度,故求出Z矩阵的问题即转换成(3)式的数学形式;S15:将Z矩阵进行分解,得到一个新的数学公式化表达:其中,Ir为r*r的单位矩阵,令Z=QJ,为一个列正交的矩阵,||Z||*=||QJ||*=||J||*。3.根据权利要求2所述的排序整合问题的求解方法,其特征在于,所述步骤S2的具体过程如下:S21:引入一个辅助矩阵变量F(i),F...

【专利技术属性】
技术研发人员:聂照昌潘炎印鉴潘文杰
申请(专利权)人:中山大学广州中大南沙科技创新产业园有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1