一种基于listwise算法在线学习排序方法技术

技术编号：21454046 阅读：37 留言：0更新日期：2019-06-26 04:49

本发明专利技术涉及信息检索技术领域，具体涉及一种基于listwise算法在线学习排序方法。首先使用listwise算法的思想，将查询关键字对应的候选记录排序列表作为训练实例；然后利用在线学习排序算法的训练过程，在应用训练实例时，训练实例按照顺序到达神经网络，并且仅被扫描一次；最后通过最小化损失值获取精准的排序模型。本发明专利技术将在线学习算法应用到listwise算法中，可以利用在线获得的数据对已有的排序模型进行更新，实现在线处理和提高算法的有效性；保证了online‑listwise算法在信息检索领域的可实施性和性能。通过自适应学习率更新排序模型，使排序模型更加精准和尽快收敛。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于listwise算法在线学习排序方法
本专利技术涉及信息检索
，具体涉及一种基于listwise算法在线学习排序方法，对当前查询关键字所对应的候选记录进行排序。
技术介绍
在信息检索领域，给定一个查询关键字，搜索引擎会召回一系列相关候选记录，然后对这些召回的候选记录进行排序，最后将前n个候选记录输出。因此，如何对候选记录的有效排序是信息检索的一个核心问题。随着机器学习算法的快速发展，使用机器学习算法来获取精准的排序模型已经得到广泛的应用。迄今为止，已经存在的学习排序算法主要分为三个类别：pointwise、pairwise、listwise。Pointwise算法利用机器学习算法预测当前查询关键字单个候选记录的排序值，简单的将排序问题归结为线性分类或者回归问题；pairwise算法是将候选记录对作为一个训练实例，并且将排序问题归结为从成对候选记录实例集合中学习分类或回归模型的任务。然而，pointwise算法和pairwise算法都不能够在训练过程中，直接通过最小化损失值获得精准的排序模型。因此，学术界提出了listwise算法解决这一问题，它是将候选记录的排序列表作为训练实例，并且通过最小化在预测列表和真实列表上定义的损失函数来优化排序模型。虽然对上述三种学习排序算法已经进行了广泛研究，但是它们都面临着相似的挑战。在每一个时间步骤中，上述三种排序算法都不能利用在线获得的数据更新排序模型。因此，随着用于信息检索的数据量越来越多，算法有效性差的问题越来越明显。为了解决该问题，学术界提出了将在线学习算法应用到学习排序算法中。在线学习算法是一种很有...

【技术保护点】
1.一种基于listwise算法在线学习排序方法，其特征在于：首先使用listwise算法的思想，将查询关键字对应的候选记录排序列表作为训练实例；然后利用在线学习排序算法的训练过程，在应用训练实例时，训练实例按照顺序到达神经网络，并且仅被扫描一次；最后通过最小化损失值获取精准的排序模型；所述的训练过程具体如下：1)初始化参数：ηt，ε，ωt；ηt其中为第t次迭代过程中的学习率；ε为容错率；ωt为第t次迭代过程中的权重系数；2)输入Xt,yt；3)计算

【技术特征摘要】
1.一种基于listwise算法在线学习排序方法，其特征在于：首先使用listwise算法的思想，将查询关键字对应的候选记录排序列表作为训练实例；然后利用在线学习排序算法的训练过程，在应用训练实例时，训练实例按照顺序到达神经网络，并且仅被扫描一次；最后通过最小化损失值获取精准的排序模型；所述的训练过程具体如下：1)初始化参数：ηt，ε，ωt；ηt其中为第t次迭代过程中的学习率；ε为容错率；ωt为第t次迭代过程中的权重系数；2)输入Xt,yt；3)计算其中排序数据的特征值用X＝[x1,x2,….,xn]∈Rdxn表示，Rdxn表示的就是d行n列的实数矩阵，Xt表示在第t次迭代过程中所用到的特征值，并且这些数据的标签值是Γ＝{l(1),l(2),…,l(n)}，其中l(i)∈{r1,r2,…,rk}表示xi的标签值，r1,r2,…,rk表示所有的标签值；y是关于X的排序列表，y(i)是在排序列表y中排在第i个位置的数据索引值；4)计算ωt+1：5)计算第t次迭代过程中的损失值Losst＝τ(f；X,y)，若Losst>ε，则执行步骤2)；否则，输出ωt，其中：其中τ(·)表示损失函数，f:λ→R是从数据特征到预测值的映射函数关系，f(x)＝ωTx，是一个线性函数关系。2.根据权利要求1所述的一种基于listwise算法在线学习排序方法，其特征在于：所述的排序列表满足对于任意的xi和xj，如果xi≥xj，则li≥lj也成立。3.根据权利要求1所...

【专利技术属性】
技术研发人员：殷海兵，李杭，黄晓峰，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人