一种数据库表结构及网络流量检索方法技术

技术编号：35065393 阅读：16 留言：0更新日期：2022-09-28 11:22

本发明专利技术提供了一种数据库表结构及网络流量检索方法，其特征在于，在流量存储检索系统中，提取数据文件与索引文件元信息的对应关系将其保存在数据库表中(以mysql数据库为例)，通过设计的特定表结构实现网络流量数据的的一级检索，结合存储检索系统中数据文件和索引文件整体提升了检索效率和降低查询结果空间的开销，也解决了检索文件和索引文件不匹配造成的检索错误，提升了检索的正确性，同时通过我们设计的表结构丰富了用户检索条件，进而提升了检索效率和用户体验。升了检索效率和用户体验。升了检索效率和用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据库表结构及网络流量检索方法

[0001]本专利技术涉及网络流量检索
，具体地说是一种数据库表结构及网络流量检索方法。

技术介绍

[0002]网络流量数据的存储与检索是网络攻击检测与故障定位、信息审计以及网络取证等领域的重要手段。随着网络应用和用户的增加，网络流数据的规模越来越大，如此高速的网络链路带给网络流量存储与检索系统巨大的挑战。为满足网络溯源、取证需求经常需要在大规模网络数据集上进行高效的检索操作。通常做法是对存储的流量数据通过五元组等报文属性建立索引文件以满足查询工作。
[0003]由于要面对高速链路、大规模网络和复杂多样应用，因此流量检索仍旧存在着大的挑战。比如目前通过五元组属性索引文件直接去数据文件中检索对应文件仍存在以下缺陷：
[0004](1)在海量数据中通过五元组等报文属性索引文件检索，扫描存储的所有文件无疑带来巨大的时间开销及查询结果存储开销；
[0005](2)当索引文件和数据文件不匹配时没有及时核实的机制造成检索错误；
[0006](3)检索匹配结果不是立即响应，而是等待最终检索出文件结果反馈，给用户造成长时间等待的不好体验；
[0007](4)没有针对网络链路级别的检索。

技术实现思路

[0008]本专利技术的目的在于提出一种数据库表结构及网络流量检索方法，以解决上述
技术介绍
中提出的问题。
[0009]为实现上述目的，本专利技术提供以下技术方案：
[0010]一种数据库表结构，数据库表结构字段包括linkI...

【技术保护点】

【技术特征摘要】
1.一种数据库表结构，其特征在于，数据库表结构字段包括linkId、data_file、pkts_num、src_ip_index_file、src_ip6_index_file、dst_ip_index_file、dst_ip6_index_file、src_port_index_file、dst_port_index_file、proto_index_file、ts_index_file、flush_start_ts、flush_end_ts和file_size字段，所述数据库表结构用于记录数据文件与索引文件的对应关系，避免查询时由于数据文件与索引文件不匹配造成检索出错；此外，它还保存了所有文件的时间戳，可以用于按时间片检索数据，避免扫描所有文件带来的巨大的时间和空间开销，同时记录了链路信息，丰富检索条件。2.根据权利要求1所述的一种数据库表结构，其特征在于，所述数据库表结构各字段具体包括以下内容：LinkId：记录当前存储的数据文件中流量数据来自的链路标识，用于区分不同链路，比如1代表存储的数据流量来自1号链路；data_file：用于记录当前存储的流量的实际数据文件路径，本例中用实时日期和时间生成目录并记录，如：202205/17/18/data0，代表的是文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的data文件名，从0开始递增，data0，data1......直到切换新的时间目录；pkts_num：记录当前存储检索系统预先设置的文件大小的data文件中包含的包数量；src_ip_index_file：记录当前保存源ipv4地址作为索引的文件路径，本例中用实时日期和时间生成目录并记录，如202205/17/18/sip4_0，代表的是sipv4作为索引的文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的sip4文件名，从0开始递增，sip4_0，sip4_1......直到切换新的时间目录；src_ip6_index_file：记录当前保存源ipv6地址作为索引的文件路径，本例中用实时日期和时间生成目录并记录，如202205/17/18/sip6_0，代表的是sipv6作为索引的文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的sip6文件名，从0开始递增，sip6_0，sip6_1......直到切换新的时间目录；dst_ip_index_file：记录当前保存目的ipv4作为索引的文件路径，本例中用实时日期和时间生成目录并记录，如202205/17/18/dip4_0，代表的是dipv4作为索引的文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的dip4文件名，从0开始递增，dip4_0，dip4_1......直到切换新的时间目录；dst_ip6_index_file：记录当前保存目的ipv6作为索引的文件路径，本例中用实时日期和时间生成目录并记录，如202205/17/18/dip6_0，代表的是dipv6作为索引的文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的dip6文件名，从0开始递增，dip6_0，dip6_1......直到切换新的时间目录；src_port_index_file：用于记录保存源端口作为索引的文件路径，本例中用实时日期和时间生成目录并记录，如202205/17/18/sport0，代表的是sport0作为索引的文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的sport文件名，从0开始递增，sport0，sport1......直到切换新的时间目录；dst_port_index_file：记录当前保存源端口作为索引的文件路径，本例中用实时日期和时间生成目录并记录，如202205/17/18/dport0，代表的是dport0作为索引的文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的dport文件名，
从0开始递增，dport0，dport1......直到切换新的时间目录；proto_index_file：用于记录保存传输层协议作为索引的文件路径，本例中用实时日期和时间生成目录并记录，如202205/17/18/proto0，代表的是proto0作为索引的文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的proto文件名，从0开始递增，proto0，proto1......直到切换新的时间目录；ts_index_file：记录当前保存data文件中每个数据包的时间戳的文件路径，本例中用实时日期和时间生成目录并记录，如202205/17/18/ts0，代表的是ts0作为索引的文件于2022年5月17日18点生成并存储在该时间点的目录，最后一级时间节点目录中的ts0文件名，从0开始递增，ts0，ts1......直到切换新的时间目录；flush_start_ts：记录当前保存的data文件中第一个包的时间戳，如2022
‑
05
‑
17 19:45:...

【专利技术属性】
技术研发人员：张广兴，姜海洋，吴颖，王伟，田利荣，夏可强，
申请(专利权)人：江苏省未来网络创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人