【技术实现步骤摘要】
基于决策树的网络协议报头压缩方法
本专利技术属于通信
,涉及一种网络协议报头压缩方法,具体涉及一种基于决策树的网络协议报头压缩方法,可用于无线通信网络中数据包的报头压缩。
技术介绍
无线信道的带宽是整个无线通信中最为宝贵和稀少的资源。而网络协议报头中某些信息,对于终端用户来说是不需要了解的,传输过长的报头信息会降低无线网络的有效载荷利用率,从而浪费无线信道带宽资源。也就是说,在进行无线传输时,如果能对网络协议报头进行压缩后传输,这样就可以大幅提高传输效率。网络协议报头压缩方法通常包括发送方确定报头中的可压缩内容、发送方与接收方确定压缩参数、发送方根据压缩参数对报头进行压缩并传输、接收方通过压缩参数对报头进行解压缩四个基本步骤。现有的网络协议报头压缩方法主要针对某种特定网络协议进行压缩,通常是采用人为分析识别的方法来确定网络协议报头中的可压缩内容,这种压缩方法只适用于这种特定的协议报头,对其他协议报头不具有适用性。例如,申请公布号为CN101568144A,名称为“一种适用于无线自组织网络的报头压缩方法” ...
【技术保护点】
1.一种基于决策树的网络协议报头压缩方法,其特征在于,包括如下步骤:/n(1)获取训练样本集和测试样本集:/n(1a)采集无线通信网络数据流中连续的M个数据包,并提取每个数据包的报头信息,得到M个报头信息,然后对每个报头信息按所属协议的字段进行划分,并从划分得到的字段值中丢弃掉字段值类型为字符串的字段值,再将剩下的属于同一流的同一协议的同一字段的字段值划分到一个集合中,最后将每个集合作为一个样本,归入样本集X中,M≥100;/n(1b)从样本集X中选取半数以上的样本,并以静态不变、递增变化、偶尔变化或无规律变化作为字段变化特征的类型标签对每个样本的字段变化特征进行标注,然后 ...
【技术特征摘要】
1.一种基于决策树的网络协议报头压缩方法,其特征在于,包括如下步骤:
(1)获取训练样本集和测试样本集:
(1a)采集无线通信网络数据流中连续的M个数据包,并提取每个数据包的报头信息,得到M个报头信息,然后对每个报头信息按所属协议的字段进行划分,并从划分得到的字段值中丢弃掉字段值类型为字符串的字段值,再将剩下的属于同一流的同一协议的同一字段的字段值划分到一个集合中,最后将每个集合作为一个样本,归入样本集X中,M≥100;
(1b)从样本集X中选取半数以上的样本,并以静态不变、递增变化、偶尔变化或无规律变化作为字段变化特征的类型标签对每个样本的字段变化特征进行标注,然后将标注好的样本归入训练样本集P中,其余样本归入测试样本集Q中;
(2)构建字段变化特征分类决策树:
(2a)以训练样本集P所含的样本中所有字段值的平均值T1、方差T2、取值个数T3、极差T4和一阶差分的方差T5分别作为样本的特征属性,构成特征属性集T,并计算训练样本集P中每个样本的特征属性Ti的值,i=1,2,3,4,5;
(2b)以特征属性集T作为C4.5算法进行学习的特征集,使用C4.5算法对训练样本集P进行学习,得到初始字段变化特征分类决策树S,并采用错误率降低剪枝法利用训练样本集Q对S进行剪枝,得到字段变化特征分类决策树S';
(3)发送方使用字段变化特征分类决策树S'对待压缩协议报头中字段的变化特征进行分类:
(3a)以字段在通信网络数据流中所用的协议中的起始比特位、结束比特位和字段值类型的三元组格式对所用的协议进行标识,并以标识好的协议为模板建立协议描述库;
(3b)发送方按照字段在待压缩协议中的起始比特位、结束比特位、字段值类型的三元组格式对待压缩协议进行标识,并将标识好的待压缩协议添加到步骤(3a)建立的协议描述库中;
(3c)发送方使用待压缩协议向接收方发送数据;
(3d)发送方从发送方到接收方之间的通信网络数据流中已发送的数据包中采集连续的L个使用待压缩协议的数据包,数据包按采集的先后顺序标记为Lj,并按照待压缩协议在协议描述库中标识的格式对这L个数据包的报头按字段进行划分,丢弃掉字段值类型为字符串的字段值,再将剩下的属于同一字段的字段值划分到一个集合中,然后分别计算每个集合中所有字段值的平均值、方差、取值个数、极差和一阶差分的方差,L≥20,j=1,2,3,...,L;
(3e)发送方分别将每个集合的字段值的平均值、方差、取值个数、极差和一阶差分的方差作为字段变化特征分类决策树S'的输入,对集合所属字段的变化特征进行分类,得到每个集合所属字段的变化特征;
(4)发送方与接收方进行压缩协商:
(4a)发送方将待压缩协议中字段值类型为字符串的字段的变化特征设定为无规律变化;
(4b)发送方将步骤(3d)采集到的第一个数据包L1作为基准数据包,并按照待压缩协议在协议描述库中的标识的格式从基准数据包的报头中提取每个字段的值,然后将变化特征属于静态不变、递增变化、偶尔变化的字段的值作为变化特征属于静态不变、递增变化、偶尔变化的字段的压缩参考值,将变化特征属于无规律变化的字段的压缩参考值设定为0;
(4c)发送方提取步骤(3d)采集到的第二个数据包L2的报头信息,然后将提取到的报头信息中变化特征属于静态不变的字段删掉,并用提取到的报头信息中变化特征属于递增变化和偶尔变化的字段的值与步骤(4b)中得到的变化特征属于递增变化、偶尔变化的字段的压缩参考值的差值代替提取到的报头信息中变化特征属于递增变化和偶尔变化的字段的值,得到一个经过压缩的报头;
(4d)发送方从步骤(4c)中得到的经过压缩的报头中获取待压缩协议的各字段在压缩后的报头中的起始比特位和结束比特位;
(4e)发送方将协商包的第一个字节作为协商包标志字节并将此标志字节的值设置为0,然后将发送方传输待压缩协议所用的IP地址、端口号和待压缩协议...
【专利技术属性】
技术研发人员:张岗山,黑乐,赵林靖,刘炯,冯磊,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。