网络数据流测量方法、系统、终端及存储介质技术方案

技术编号：37547885 阅读：17 留言：0更新日期：2023-05-12 16:23

本发明专利技术公开了一种网络数据流测量方法、系统、终端及存储介质，通过线性计数LC估计器，对待测量数据流进行基数估计，得到第一基数估计值；以及实时获取LC估计器进行基数估计时的估计器状态；在LC估计器的估计器状态为充满状态的情况下，通过超级日志计数HLL估计器，对待测量数据流中未被LC估计器进行基数估计的数据包进行基数估计，得到第二基数估计值；其中，待测量数据流包括若干数据包；根据第一基数估计值和第二基数估计值，确定待测量数据流的基数估计值。通过上述方案，在用于数据流基数估计的存储空间有限的情况下，有效避免由较小的数据流引起的存储空间浪费，大幅提升了空间利用率，保证了数据流基数估计的高准确度。保证了数据流基数估计的高准确度。保证了数据流基数估计的高准确度。

全部详细技术资料下载

【技术实现步骤摘要】
网络数据流测量方法、系统、终端及存储介质

[0001]本专利技术涉及网络测量
，尤其涉及一种网络数据流测量方法、系统、终端及计算机可读存储介质。

技术介绍

[0002]数据流是一组有序、有终点和起点的字节的数据序列，其数据规模和数据值范围往往是不可预知的。基数是指一个集合中不同的元素的个数。对数据流进行基数估计，在数据库优化、网络监控、数据分析等领域都有着广泛的应用需求。目前常见的基数估计算法主要有Linear Counting、LogLog Counting、Adaptive Counting及HyperLogLog Counting等，可以将基数估计算法封装为对应的基数估计器，用于估计数据流的基数。例如，LogLog Counting对应的线性计数(LogLog Counting，LC)估计器，HyperLogLog Counting对应的超级日志计数(HyperLogLog Counting，HLL)估计器。
[0003]日益增长的网络带宽使得端主机系统逐渐难以更上数据流的线速率，这就使得越来越多的网络测量任务(例如：数据流的基数估计)被卸载在高速硬件上，例如智能网卡、可编程交换机等。但是网络测量任务作为辅助功能，通常智能占据上述高速硬件中的小部分存储资源，例如在可编程交换机中，存储资源有限分配给路由表以及访问控制列表。
[0004]传统方式中是将一片连续的存储空间划分为若干相等大小空间以存储对应的基数估计器，并借用Count
‑
Min Sketch的共享机制让每条数据流...

【技术保护点】

【技术特征摘要】
1.一种网络数据流测量方法，其特征在于，所述方法包括：通过线性计数LC估计器，对待测量数据流进行基数估计，得到第一基数估计值；以及实时获取所述LC估计器进行基数估计时的估计器状态；在所述LC估计器的估计器状态为充满状态的情况下，通过超级日志计数HLL估计器，对所述待测量数据流中未被所述LC估计器进行基数估计的数据包进行基数估计，得到第二基数估计值；其中，所述待测量数据流包括若干所述数据包；根据所述第一基数估计值和所述第二基数估计值，确定所述待测量数据流的基数估计值。2.根据权利要求1所述的网络数据流测量方法，其特征在于，若干所述LC估计器存储于第一层存储空间，若干所述HLL估计器存储于第二层存储空间；其中，所述第一层存储空间和所述第二层存储空间为对用于数据流基数估计的连续存储空间划分得到的。3.根据权利要求2所述的网络数据流测量方法，其特征在于，通过所述LC估计器，对所述待测量数据流进行基数估计，具体包括：控制所述待测量数据流的数据包依次流入所述第一层存储空间；通过所述第一层存储空间中的所述LC估计器对流入所述第一层存储空间的所述数据包进行基数估计，得到所述第一基数估计值。4.根据权利要求2所述的网络数据流测量方法，其特征在于，所述通过所述HLL估计器，对所述待测量数据进行基数估计，得到第二基数估计值，具体包括：在所述LC估计器的估计器状态为充满状态的情况下，控制所述待测量数据流中未被所述LC估计器进行基数估计的所述数据包流向第二层存储空间；通过所述第二层存储空间的所述HLL估计器对流入所述第二层存储空间的所述数据包进行基数估计，得到所述第二基数估计值。5.根据权利要求1所述的方法，其特征在于，实时获取所述LC估计器进行基数估计时的估计器状态，具体包括：实时获取所述LC估计器进行基数估计时位图中被置1的比特个数；在所述LC估计器的所述位图中被置1的比特个数大于预设阈值的情况下，确定所述LC估计器的估计器状态为充满状态；在所述在所述LC估计器的所述位图中被置1的比特个数小于所述预设阈值的情况下，确定所述LC估计器的估计器状态为非充满状态。6.根据权利要求1所述的网络数据流测量方法，其特征在于，在获取所述LC估计器进行基数估计时的估计器状态之后，所述方法还包括：在所述LC估计器的估计器状态为非充满状态的情况下，确定所述待测量数...

【专利技术属性】
技术研发人员：陈贵海，李伟超，陶小峰，
申请(专利权)人：鹏城实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人