一种基于R-TBF的RFID冗余数据清洗方法技术

技术编号：15639499 阅读：260 留言：0更新日期：2017-06-15 23:56

本发明专利技术公开了一种基于R‑TBF的RFID冗余数据清洗方法，首先初始化过滤器，包括用于保存数据时间属性的整数数组M、哈希函数、映射函数、Map集合P以及时间阈值τ和强度阈值α；然后对当前数据X进行冗余判断，按照{ID,TIME,RSSI}格式传输和清洗规则进行冗余清洗：最后处理完当前数据X后；本发明专利技术提供的基于R‑TBF的RFID冗余数据清洗方法，考虑了时间因素和强度因素两种限制条件对数据进行相应的清洗，通过一次时间戳清洗和二次强度值清洗，改善清洗效果，提高数据质量，最大程度还原数据真实性，为后续数据的有效利用提供有力保证。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于R-TBF的RFID冗余数据清洗策略
本专利技术涉及数据清洗
，特别是一种基于R-TBF的RFID冗余数据清洗策略。
技术介绍
射频识别技术以其非接触、非视距等特点在物流、供应链等领域有着广泛的应用，特别是随着现代计算机和智能仓储建设的发展，RFID技术的应用更加普遍。RFID数据是RFID应用的重要组成部分，RFID数据的质量对于RFID技术的应用有着重要的影响。而在实际RFID应用中，由于其非接触、非视距的特点，在读写器未靠近目标标签时，就已经产生了大量目标标签的数据，这些数据带有一定的冗余性；另外，由于实际应用中往往有多个读写器同时工作，在相近时间内针对同一目标标签也会产生大量冗余数据，这些冗余数据的产生在整个RFID应用过程中是无法避免的，而这些冗余数据的存在也对RFID应用的普及造成了限制。除此之外，在RFID应用中，RFID数据大都具有流动性的特点，这对其处理提出了更大的挑战，所以针对RFID冗余数据的清洗面临的主要问题就是对于大量的RFID数据流，如何在较短的时间和较小的空间对其进行实时清洗，这对清洗算法在执行时间和占用空间上提出了更高的要求。目前针对RFID冗余数据的清洗方法有很多，Alonso提出基于语句查询的可扩展数据流清洗模型ESP，但是它需要保存所有要处理的数据，不符合RFID数据流的动态性要求，还会占用大量内存空间；另外，布隆于1970年提出BloomFilter(以下简称BF)，BF以其低内存占比和高效查询等特点，目前在数据清洗领域得到了广泛应用，Metwally使用BF检测冗余数据，由于BF无删除功能，数据量足够...
一种<a href="http://www.xjishu.com/zhuanli/55/201611269752.html" title="一种基于R-TBF的RFID冗余数据清洗方法原文来自X技术">基于R-TBF的RFID冗余数据清洗方法</a>

【技术保护点】
一种基于R‑TBF的RFID冗余数据清洗策略，其特征在于：包括以下步骤：步骤1：初始化过滤器，初始化内容包括：11)用于保存数据时间属性的整数数组M，大小为m；12)k个用于将数据标签信息映射到整数数组的哈希函数h

【技术特征摘要】
1.一种基于R-TBF的RFID冗余数据清洗策略，其特征在于：包括以下步骤：步骤1：初始化过滤器，初始化内容包括：11)用于保存数据时间属性的整数数组M，大小为m；12)k个用于将数据标签信息映射到整数数组的哈希函数h1…hk；13)用于将整数数组下标值映射到Map集合键值的映射函数HK；14)Map集合P，用来保存数据强度属性，其大小跟随数据量大小变化；15)时间阈值τ和强度阈值α，分别确定数据的时间属性和强度属性是否冗余；时间阈值τ的取值范围为：300ms～600ms；强度阈值α的取值范围为：2dB～5dB；步骤2：对当前数据X进行冗余判断，所述当前数据X按照{ID,TIME,RSSI}格式传输并按照以下清洗规则进行冗余清洗：其中，ID表示货包标签号；TIME表示此标签号被读取时的时间戳；RSSI表示此标签被读取时的强度值；21)首先将当前数据X中的X.ID通过k个哈希函数映射到整数数组M的k个不同位置，判断k个位置是否都已被赋值，如果k个位置中至少有一个位置未被赋值，则说明数据X未被处理过，直接将X.TIME更新至此k个位置，并根据映射函数HK更新X.RSSI到指定位置：其中，j的取值为整数数组中被选中的k个位置的下标，根据二进制位权规则，算出X.HK，将其作为Map集合的键，将X.RSSI作为Map集合的对应值，对X的RSSI值进行保存；22)如果k个位置均被赋值，则说明X.ID相同的数据已被处理过，则需要对当前数据X进行冗...

【专利技术属性】
技术研发人员：孙棣华，郑林江，赵敏，刘卫宁，朱文霖，
申请(专利权)人：重庆大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人