【技术实现步骤摘要】
基于位图计算的报文采样方法、装置、设备和介质
[0001]本申请涉及网络数据处理领域,特别是涉及一种基于位图计算的报文采样方法、装置、计算机设备以及计算机可读存储介质。
技术介绍
[0002]近年来,随着信息技术的迅速发展以及应用系统规模的快速增长,由此产生的数据也呈现井喷式增长,寻求有效的大数据处理技术已成为当研究的热点问题。许多公司也在关注相关技术,以满足自身的业务需求。在报文的流量获取过程中需要对报文的端口进行过滤,保留指定端口(可能有多个指定端口)流量的报文,丢弃非指定端口流量的报文。常规的端口过滤方案有两种,第一种通过遍历数组查询过滤;第二种是通过hash表查询过滤。第一种方案需要遍历数组,占用内存较大而且查询效率低。第二种方案端口查询复杂度为常数级,对内存占用较高。
[0003]针对现有的端口过滤技术中,存在存放报文的端口号占用空间大且端口号标识查询效率低的问题,目前尚未提出有效的解决方法。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种基于位图计算的报文采样方法、装置 ...
【技术保护点】
【技术特征摘要】
1.一种基于位图计算的报文采样方法,其特征在于,包括以下步骤:获取待查询报文的端口号对应的第一数字,所述第一数字为二进制数;将所述第一数字进行右移三位的位运算,得到第二数字;将所述第一数字与111进行按位与运算,得到第三数字;获取第一数组中,所述第二数字加1对应的8比特数组元素中,所述第三数字的位置对应的数组元素的值,根据所述数组元素的值确定所述待查询报文的端口号对应的报文是否被采样;所述第一数组为基于所有报文的端口号标识预先创建的,所述第一数组的所述数组元素的值代表所述待查询报文的端口号标识。2.根据权利要求1所述的基于位图计算的报文采样方法,其特征在于,在所述获取待查询报文的端口号对应的第一数字之前,所述方法还包括以下步骤:获取所有报文的最大端口号对应的第四数字,申请一个连续的第二数组存放所有报文的端口号标识,所述第二数组大小为所述第四数字,所述第四数字为十进制数;遍历所有报文的端口号,当确定当前端口号对应的报文需要被采样的情况下,将所述第二数组中当前端口号对应的位置的数组元素的值置1。3.根据权利要求1所述的基于位图计算的报文采样方法,其特征在于,在所述获取待查询报文的端口号对应的第一数字之前,所述方法还包括以下步骤:获取所有报文的最大端口号对应的第五数字,所述第五数字为二进制数;将所述第五数字进行右移三位的位运算,得到第六数字;将所述第六数字加1之后再乘以8得到第七数字,申请一个连续的第三数组存放所有报文的端口号标识,所述第三数组大小为所述第七数字;遍历所有报文的端口号,将当前端口号对应的第八数字进行右移三位的位运算,得到第九数字,将所述第八数字与111进行按位与运算,得到第十数字,所述第八数字为二进制数;当确定当前端口号对应的报文需要被采样的情况下,将所述第三数组中,第九数字加1对应的8比特数组元素中,所述第十数字的位置对应的数组元素的值置1。4.根据权利要求2所述的基于位图计算的报文采样方法,其特征在于,在所述遍历所有报文的端口号,当确定当前端口号对应的报文需要被采样的情况下,将所述第二数组中当前端口号对应的位置的数组元素的值置1之后,所述方法还包括:当确定当前端口号对应的报文需要被过滤的情况下,将所述第二数组中当前端口号对应的位置的数组元素...
【专利技术属性】
技术研发人员:陈泽楠,范渊,黄进,
申请(专利权)人:杭州安恒信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。