一种基于DPI话单的海量数据检索方法技术

技术编号:43676530 阅读:20 留言:0更新日期:2024-12-18 21:00
本发明专利技术涉及一种基于DPI话单的海量数据检索方法,属于DPI数据检索技术领域。包括以下步骤:S1:数据收集:采用DPI对收集的数据流进行识别,之后将其进行格式获取收集的DPI话单数据;S2:DPI话单数据处理:对收集到的DPI话单数据进行清洗、整理和汇总,通过数据服务器处理最终建立DPI话单数据存储库;S3:建立关键词:从收集的DPI数据中获取UserAgent字段,对所述UserAgent字段进行分词,获得一个或多个关键词;S4:建立关键词数据库;S5:数据检索;S6:数据呈现;S7:数据分析汇总。本发明专利技术通过这种基于DPI话单的海量数据检索方法,可以有效地处理和检索海量的DPI话单数据,提供高效的查询服务和深入的分析见解,检索效率大大提高。

【技术实现步骤摘要】

本专利技术涉及一种基于dpi话单的海量数据检索方法,属于dpi数据检索。


技术介绍

1、dpi(deep packet inspection,深度包检测)话单数据通常指的是通过网络检测技术收集的网络通信数据。。dpi话单的海量数据检索方法主要依赖于深度数据包检测(dpi)技术,通过分析网络流量数据,实现对网络行为的深入洞察和高效检索。

2、目前在对dpi话单的海量数据进行检索时,最为常见的方式是通过获得dpi话单的海量数据库,然后输入关键词从dpi话单的海量数据库惊醒查询检索相应的数据,这种检索方式往往难以有效地处理和检索海量的dpi话单数据,难以提供高效的查询服务和深入的分析见解,检索效率有待提高。

3、基于此,本专利技术提供一种基于dpi话单的海量数据检索方法。


技术实现思路

1、有鉴于此,本专利技术提供一种基于dpi话单的海量数据检索方法,可以有效地处理和检索海量的dpi话单数据,提供高效的查询服务和深入的分析见解,检索效率大大提高。

2、本专利技术提供一种基于dpi本文档来自技高网...

【技术保护点】

1.一种基于DPI话单的海量数据检索方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于DPI话单的海量数据检索方法,其特征在于:所述在步骤S1中:通过网络检测技术进行收集海量网络流量信息形成数据流,采用DPI对所述数据流进行识别,并获得经过识别的DPI数据,将DPI数据进行格式转化,获得收集的DPI话单数据。

3.根据权利要求1所述的一种基于DPI话单的海量数据检索方法,其特征在于:所述在步骤S2中:数据服务器对海量数据进行压缩,以减少存储需求并加速检索,数据压缩方法采用RLE压缩算法、Lempel-Ziv压缩算法中的其中一种,使用Spark对数据...

【技术特征摘要】

1.一种基于dpi话单的海量数据检索方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于dpi话单的海量数据检索方法,其特征在于:所述在步骤s1中:通过网络检测技术进行收集海量网络流量信息形成数据流,采用dpi对所述数据流进行识别,并获得经过识别的dpi数据,将dpi数据进行格式转化,获得收集的dpi话单数据。

3.根据权利要求1所述的一种基于dpi话单的海量数据检索方法,其特征在于:所述在步骤s2中:数据服务器对海量数据进行压缩,以减少存储需求并加速检索,数据压缩方法采用rle压缩算法、lempel-ziv压缩算法中的其中一种,使用spark对数据进行并行处理,可以将检索任务分发到多个计算节点,提高检索效率。

4.根据权利要求1所述的一种基于dpi话单的海量数据检索方法,其特征在于:所述在步骤s3中:采用正则表达式类对ueragent字段进行分词。

5.根据权利要求1所述的一种基于dpi话单的海量数据检索方法,其特征在于:所述在步骤s1中:dpi话单数据包括通信...

【专利技术属性】
技术研发人员:苏婷婷
申请(专利权)人:北京海福瑞科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1