一种适用于大数据分发的Q‑learning拥塞控制方法技术

技术编号：11729676 阅读：91 留言：0更新日期：2015-07-15 02:21

一种适用于大数据分发的Q‑learning拥塞控制方法。本发明专利技术提供一种在对等网络中查找资源的方法和装置，能够使非结构化P2P网络中的资源查找时间明显降低，并具有更低的网络拥塞，以及提高了查找成功率。本发明专利技术的在对等网络中查找资源的方法包括：使用Q‑学习方法计算对等网络中各节点的Q值；在对等网络中，判断发起资源查找的当前节点是否有邻居节点包含所述资源；若是，则向包含所述资源的邻居节点中的Q值最大的节点发送资源查找消息；否则将资源查找消息发送给该当前节点的所有邻居节点中Q值最大的节点然后由该Q值最大的节点发起资源查找。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机网络技术，特别地涉及一种在对等网络中查找资源的方法和装置。
技术介绍
近年来，对等(Peer-to-Peer，P2P)网络已逐渐发展成一种重要的网络模式。这是因为与传统的客户机/服务器(Client/Server，C/S)模式相比，对等网络具有容错性好、可扩展性强、成本低廉、可以充分利用分布资源等优势。对等网络在文件共享、分布式计算、流媒体服务等发面已有广泛的应用。对等网络分为两种：有结构的和无结构的，有结构的对等网络对节点的连接有严格的限制，而无结构的对等网络节点的连接有很大的自由度。由于无结构对等网络节点的分布式特点，节点只知道其邻居节点的资源，却并不知道网络中其它节点上资源的分布情况，因此无结构对等网络中一个极大的难题是网络中的资源定位问题。为此已经提出许多搜索方法来实现无结构对等网络上资源的有效定位，如洪泛法、random walks、APS(Adaptive Probability Search)等。然而以上方法在资源查找过程中由于查找消息的转发，导致网络中部分节点在查找过程中需要处理的消息过多而出现消息拥塞，进而严重影响搜索的继续进行，造成搜索性能的下降。因而如何在对等网络中实现负载均衡就显得尤为重要。
技术实现思路
有鉴于此，本专利技术提供一种在对等网络中查找资源的方法和装置，能够使非结构化P2P网络中的资源查找时间明显降低，并具有更低的网络拥塞，以及

【技术保护点】
一种在对等网络中查找资源的方法，其特征在于，包括：使用Q‑学习方法计算对等网络中各节点的Q值；在对等网络中，判断发起资源查找的当前节点是否有邻居节点包含所述资源；若是，则向包含所述资源的邻居节点中的Q值最大的节点发送资源查找消息；否则将资源查找消息发送给该当前节点的所有邻居节点中Q值最大的节点然后由该Q值最大的节点发起资源查找。

【技术特征摘要】
1.一种在对等网络中查找资源的方法，其特征在于，包括：
使用Q-学习方法计算对等网络中各节点的Q值；
在对等网络中，判断发起资源查找的当前节点是否有邻居节点包
含所述资源；若是，则向包含所述资源的邻居节点中的Q值最大的节
点发送资源查找消息；否则将资源查找消息发送给该当前节点的所有
邻居节点中Q值最大的节点然后由该Q值最大的节点发起资源查找。
2.根据权利要求1所述的方法，其特征在于，由该Q值最大的节
点发起资源查找的步骤包括：
所述该Q值最大的节点确认收到的资源查找消息的存活时间不为
0，然后发起资源查找。
3.根据权利要求1所述的方法，其特征在于，所述Q-学习方法中，
求Q值的公式如下：
Qnew(s,a)＝Q(s,a)+αQlocal(s,a)+β×Ι(U-CLi(t))×CLi(t)；
其中，Qnew(s,a)表示Q的新值，Q(s,a)表示Q的老值，α表示学习
速率，Qlocal(s,a)表示被学习的值，β表示拥塞因素，函数I(x)在x≤0时
取值-1，x>0时取值1，函数CL的计算公式为：
Cl P j ( t ) = 1 + Q P t ( t ) C P j ; ]]>其中，表示节点Pj处理一条查找消息所需的时间；表示
时刻t节点Pj的缓存队列中待处理的消息数；
Qlocal(s,a)的计算公式为：Qlocal(s,a)＝R(s)+γmaxa′Q(s′,a′)；
其中，γ表示折扣因子，maxa′Q(s′,a′)表示当前状态的下一状态所
获得的最大Q值，其中s'和a'分别为下一状态和对应的行为；R表示奖
赏值，其计算公式为：
R = Σ k = 0 k γ k A ...

【专利技术属性】
技术研发人员：崔凯，
申请(专利权)人：北京智芯原动科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人