【技术实现步骤摘要】
数据流中数据项基数的估算方法及相关设备
[0001]本专利技术涉及数据处理
,特别涉及一种数据流中数据项基数的估算方法及相关设备。
技术介绍
[0002]数据流是网络传输中一组有序的数据序列,数据流中包含有多种不同类型的数据项,通过分析不同数据项的基数,可以有效判断网络传输过程中数据的应用情况,进而对相关的网络应用进行优化改进。因此,数据流中数据项基数的估计,已成为数据流挖掘的基础问题之一。
[0003]目前,对数据流中数据项基数的估计过程,所采用的估计算法,往往在某个时间区间内以估计器的最终状态为指示量,丢弃了部分中间信息,导致最终的数据项基数估计误差较大,对数据项基数的估计准确率低。
技术实现思路
[0004]鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种数据流中数据项基数的估算方法及相关设备,技术方案如下所述:一种数据流中数据项基数的估算方法,包括:提取当前数据流中的目标数据项;计算所述目标数据项对应的哈希值,并确定所述哈希值对应的比特串;在所述比特串中提取第 ...
【技术保护点】
【技术特征摘要】
1.一种数据流中数据项基数的估算方法,其特征在于,包括:提取当前数据流中的目标数据项;计算所述目标数据项对应的哈希值,并确定所述哈希值对应的比特串;在所述比特串中提取第一比特子串,并确定所述第一比特子串对应的目标寄存器,所述目标寄存器设置于已设定的存储结构中,所述存储结构设置有多个寄存器;确定第一数值,所述第一数值为所述比特串在预定方向上开始连续0比特的数量值;判断所述第一数值是否大于所述目标寄存器的当前值;若所述第一数值大于所述目标寄存器的当前值,则更新所述目标寄存器的当前值为所述第一数值,并根据所述目标寄存器的当前值对所述目标数据项所对应计数器的计数值进行更新,以实现对数据流中数据项基数的估算。2.根据权利要求1所述的方法,其特征在于,还包括:若所述第一数值不大于所述目标寄存器的当前值,则结束对所述目标数据项的操作。3.根据权利要求1所述的方法,其特征在于,所述提取当前数据流中的目标数据项,包括:实时对所述当前数据流中的各个数据项进行监测,当监测到与预定数据项类型相匹配的数据项时,提取该数据项为目标数据项。4.根据权利要求1所述的方法,其特征在于,所述在所述比特串中提取第一比特子串,包括:确定所述比特串的起始位置;从所述起始位置起,提取所述比特串的前N个比特组成所述第一比特子串,所述N为正整数。5.根据权利要求1所述的方法,其特征在于,所述预定方向为所述比特串由右至左的方向。6.根据权利要求1所述的方法,其特征在于,还包括:在进行数据项基数估算前,对所述存储结构及所述计数器进行初始化操作。7.根据权利要求1所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:刘博,袁海滨,
申请(专利权)人:北京傲星科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。