当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于RFID数据强度‑时间分布的初始聚类中心优化选取方法技术

技术编号:16718366 阅读:69 留言:0更新日期:2017-12-05 16:38
本发明专利技术公开了一种基于RFID数据强度‑时间分布的初始聚类中心优化选取方法,包括以下子步骤:根据移动扫描终端的移动速度、货包规格确定时间跨度;将经过预处理后的RFID数据集从起始时间开始,对每一个时间跨度内强度值大于设定阈值的数据进行筛选;计算每个时间跨度内数据的平均强度,并将平均强度和对应时间跨度时间区间的右端点进行保存;利用爬山法对保存的平均强度根据强度阈值进行聚类中心区域和非聚类中心区域划分;对于被划分为聚类中心区域的连续时间区间进行区间相连,取相连形成的区间的时间中点作为初始聚类中心,求出所有初始聚类中心。本发明专利技术利用RFID扫描数据的强度‑时间分布规律选取初始聚类中心,改善聚类中心的选取,提高聚类结果的准确性及稳定性。

An initial clustering center distribution time data selecting method based on the strength of RFID

The invention discloses an initial clustering center time data of RFID intensity distribution optimization selection method based on the following sub steps: according to the movement of the scanning speed of the mobile terminal, package specifications to determine the time span; after RFID pre processed data set from the start time of each time span strength value screening is greater than the set threshold data; calculation of average intensity data each time span, and the right endpoint average intensity and the corresponding time span of time interval to save; using the hill-climbing method to save the average strength of the cluster center area and non cluster center area is divided according to the intensity threshold for; be divided into continuous time interval clustering the central region of the interval is the time interval from the connected point as the initial clustering center for all the initial poly Class center. The invention uses strength time RFID scan data of the distribution of the selection of initial cluster center, improve the selection of cluster center, improve the accuracy and stability of the clustering results.

【技术实现步骤摘要】
一种基于RFID数据强度-时间分布的初始聚类中心优化选取方法
本专利技术涉及初始聚类中心选取
,特别是涉及一种基于RFID数据强度-时间分布的初始聚类中心优化选取方法。
技术介绍
射频识别技术具有许多传统的无线通信手段所不具备的优点:非接触、非视距、多目标识别而且定位精度高、成本低、布设方便、抗干扰能力强、环境适应能力强,因而在仓库货包定位技术中得到了广泛的关注。在实际仓库货包定位应用中,利用移动RFID阅读器-多天线阵列采集的RFID扫描数据其强度-时间分布具有一定规律性,具体表现为:当移动RFID阅读器-多天线阵列靠近RFID电子标签时,标签返回的RSSI值较大;当移动RFID阅读器-多天线阵列原理RFID电子标签时,标签返回的RSSI值较小。可以根据上述规律对RFID扫描数据进行划分,进而判断货包的位置。聚类分析是数据挖掘领域中常用的分析方法,能够将数据对象分成多个簇或组,同一组中的对象之间具有较高的相似度,不同组中的数据对象差别较大,可以根据RFID扫描数据的分布特点将其进行聚类。所以,仓库货包定位问题就转化为RFID扫描数据的聚类问题。目前聚类分析的方法有很多,基于划分的K-Means聚类算法可以方便高效地将RFID扫描数据根据其强度-时间分布特征进行精确划分,算法复杂度低,可在短时间内处理大量RFID扫描数据。而传统的K-Means聚类算法对初始聚类中心依赖性强,初始聚类中心的不同选择往往导致聚类结果不稳定,会增加迭代次数,降低算法执行效率。目前,有很多研究人员致力于改进K-Means聚类算法的初始聚类中心选取方法。韩凌波等提出一种初始聚类中心优化选取算法,该算法通过计算每个数据对象的密度参数,选取其中k个高密度点作为初始聚类中心;张健沛等提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图将数据对象空间进行最优划分,根据数据对象的密度分布自动确定初始聚类中心,无需预置k值,减少了算法结果对参数的依赖,提高算法效率及准确率;Kaufman提出一种典型的密度估计KR方法,它通过计算两两距离估计数据分布的密度,然后从具有较高局部密度的区域中的数据里选取初始聚类中心;牛琨等提出的基于超三角形的融合网格密度的选取办法能够摆脱预设k值的干扰;还有基于均值-标准差选取方法,基于超立方体选取方法,基于近邻密度选取方法等,这些算法避免了传统K-Means算法中初始聚类中心的随机选取,能够一定程度上加快算法的收敛速度,使算法效率有所提高,但是上述算法大多都是基于数据密度,针对RFID扫描数据在时间上的密度分布变化不明显的情况,其适用性大大降低。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于RFID数据强度-时间分布的初始聚类中心优化选取方法。为达到上述目的,本专利技术提供如下技术方案,一种基于RFID数据强度-时间分布的初始聚类中心优化选取方法,包括以下步骤:步骤1:根据移动扫描终端的移动速度、货包规格确定时间跨度tspan;步骤2:将经过预处理后的RFID数据集从起始时间开始,对每一个时间跨度tspan内强度值大于设定阈值的数据进行筛选;步骤3:计算每个时间跨度tspan内数据的平均强度Rarg,并将平均强度Rarg和对应时间跨度tspan时间区间的右端点进行保存;步骤4:重复第2、3步骤,直到数据集中所有数据全部处理并保存;步骤5:利用爬山法对步骤4保存的平均强度Rarg根据强度阈值MinR进行聚类中心区域和非聚类中心区域划分;步骤6:对于被划分为聚类中心区域的连续时间区间进行区间相连,取相连形成的区间的时间中点作为初始聚类中心,求出所有初始聚类中心;步骤7:根据步骤6计算所有的初始聚类中心点并输出,然后算法结束。进一步,所述设定阈值为-45db。进一步,聚类中心区域和非聚类中心区域的划分方法为:若平均强度Rarg大于阈值MinR,则认为此时间区间为聚类中心区域,否则为非聚类中心区域;所述阈值MinR根据经验设定。本专利技术的有益效果在于:本专利技术利用RFID扫描数据的强度-时间分布规律选取初始聚类中心,改善聚类中心的选取,提高聚类结果的准确性及稳定性。附图说明为了使本专利技术的目的、技术方案和有益效果更加清楚,本专利技术提供如下附图进行说明:图1RFID数据采集过程图;图2RFID数据强度-时间分布图;图3为本专利技术算法流程图。具体实施方式下面将结合附图,对本专利技术的优选实施例进行详细的描述。本专利技术是根据实际应用场景中RFID数据的采集模式即移动扫描终端沿着指定方向行进,扫描其周围静态放置的RFID电子标签,具体采集过程如图1所示。在采集过程中,某一位置RFID电子标签的强度-时间分布呈现出一定的规律性,即当阅读器靠近RFID电子标签时,其接收到的RSSI值较大;当阅读器远离RFID电子标签时,其接收到的RSSI值较小,如图2所示。根据RFID扫描数据的这种强度-时间分布规律,选取强度最大值所对应的时间点作为初始聚类中心点,可以改善聚类中心的选取,提高聚类结果的准确性及稳定性。具体
技术实现思路
如下:步骤1:根据移动扫描终端移动速度、货包规格确定时间跨度tspan。步骤2:将经过预处理后的RFID数据集从起始时间开始,对每一个tspan内强度值大于-45db的数据进行筛选,这样选取是因为电磁波在Y方向上传播其强度值逐渐衰减且受干扰严重,强度值太小的数据会影响聚类中心选取的准确性,必须将其剔除。具体地,根据RFID数据集的tmin(最小时间)和tmax(最大时间)以及步骤1中计算得出的tspan(时间跨度)对整个RFID数据集进行时间分段;针对每个分段(时间区间[tmin,tmin+tspan])内强度值大于-45db的数据进行筛选,目的是减少干扰严重的数据的影响,使数据强度变化明显。步骤3:计算每个tspan(时间区间[tmin,tmin+tspan])内数据的平均强度Rarg,并将Rarg和对应tspan时间区间的右端点(tmin+tspan)进行保存,平均强度计算公式为:其中,n为tspan时间区间内经筛选后RFID数据的个数,xi.RSSI表示tspan时间区间内第i个RFID数据的强度值。步骤4:重复第2、3步骤,直到数据集中所有数据全部处理并保存。步骤5:利用爬山法对上述步骤保存的平均强度Rarg根据强度阈值MinR进行聚类中心区域和非聚类中心区域划分。沿着时间轴方向比较每一个时间跨度的平均强度Rarg与强度阈值MinR,如果Rarg大于MinR,则认为是聚类中心区域,否则为非聚类中心区域,非聚类中心区域用于将聚类中心区域区分开。步骤6:对于被划分为聚类中心区域的连续时间区间进行区间相连,聚类中心必定包含在这段时间区间内,取这段时间区间的中间时间作为初始聚类中心,求出所有初始聚类中心。步骤7:根据步骤6计算所有的初始聚类中心点并输出,然后算法结束。最后说明的是,以上优选实施例仅用以说明本专利技术的技术方案而非限制,尽管通过上述优选实施例已经对本专利技术进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本专利技术权利要求书所限定的范围。本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/201710545656.html" title="一种基于RFID数据强度‑时间分布的初始聚类中心优化选取方法原文来自X技术">基于RFID数据强度‑时间分布的初始聚类中心优化选取方法</a>

【技术保护点】
一种基于RFID数据强度‑时间分布的初始聚类中心优化选取方法,其特征在于:包括以下步骤:步骤1:根据移动扫描终端的移动速度、货包规格确定时间跨度tspan;步骤2:将经过预处理后的RFID数据集从起始时间开始,对每一个时间跨度tspan内强度值大于设定阈值的数据进行筛选;步骤3:计算每个时间跨度tspan内数据的平均强度Rarg,并将平均强度Rarg和对应时间跨度tspan时间区间的右端点进行保存;步骤4:重复第2、3步骤,直到数据集中所有数据全部处理并保存;步骤5:利用爬山法对步骤4保存的平均强度Rarg根据强度阈值MinR进行聚类中心区域和非聚类中心区域划分;步骤6:对于被划分为聚类中心区域的连续时间区间进行区间相连,取相连形成的区间的时间中点作为初始聚类中心,求出所有初始聚类中心;步骤7:根据步骤6计算所有的初始聚类中心点并输出,然后算法结束。

【技术特征摘要】
1.一种基于RFID数据强度-时间分布的初始聚类中心优化选取方法,其特征在于:包括以下步骤:步骤1:根据移动扫描终端的移动速度、货包规格确定时间跨度tspan;步骤2:将经过预处理后的RFID数据集从起始时间开始,对每一个时间跨度tspan内强度值大于设定阈值的数据进行筛选;步骤3:计算每个时间跨度tspan内数据的平均强度Rarg,并将平均强度Rarg和对应时间跨度tspan时间区间的右端点进行保存;步骤4:重复第2、3步骤,直到数据集中所有数据全部处理并保存;步骤5:利用爬山法对步骤4保存的平均强度Rarg根据强度阈值MinR进行聚类中心区域和非聚类中心区域划分;...

【专利技术属性】
技术研发人员:孙棣华赵敏郑林江朱文霖
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1