【技术实现步骤摘要】
一种数据包的处理方法及装置
[0001]本申请涉及计算机网络技术及云技术的大数据处理技术,尤其涉及一种数据包的处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]大数据(Big Data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。当前互联网的主要应用(如:应用下载,视频流媒体等)由传输控制协议(TCP,Transmission Control Protocol)承载,而网络丢包识别技术作为TCP协议的重要组成部分直接影响TCP协议的传输性能。
[0003]相关技术中,通常采用提前确认(FACK,Forward ACKnowledgement)方法 ...
【技术保护点】
【技术特征摘要】
1.一种数据包的处理方法,其特征在于,所述方法包括:对发送的数据包序列和接收的确认包进行特征提取,以得到网络特征;基于所述网络特征对所述数据包序列进行位置预测处理,以确定所述数据包序列中位于已收数据包之后的最远丢包位置;其中,所述已收数据包是所述数据包序列中被所述确认包所确认接收的数据包;将所述数据包序列中位于所述已收数据包和所述最远丢包位置之间、且未被确认收到的数据包,确定为丢失的数据包。2.根据权利要求1所述的方法,其特征在于,所述对发送的数据包序列和接收的确认包进行特征提取,以得到网络特征,包括:当接收到针对所述数据包序列中的任意一个数据包的确认包时,从传输协议栈提取所述确认包的时间特征和/或空间特征,以作为与所述确认包对应的网络特征。3.根据权利要求2所述的方法,其特征在于,所述时间特征包括以下至少之一:往返时延特征、拥塞窗口特征、乱序窗口特征;所述从传输协议栈提取所述确认包的时间特征,包括:从所述传输协议栈提取所述已收数据包的往返时延,以作为所述往返时延特征;确定所述数据包序列中在所述已收数据包之后的数据包的数量,以作为所述乱序窗口特征;将接收到所述确认包时所述数据包序列的拥塞窗口的值与预设拥塞阈值的加和,作为所述确认包的拥塞窗口特征;其中,所述拥塞窗口特征大于初始化的拥塞窗口的值、且小于或等于拥塞阈值。4.根据权利要求2所述的方法,其特征在于,所述空间特征包括以下至少之一:区间数量特征、被选择性确认数量特征、最大差值数量特征;所述从传输协议栈提取所述确认包的空间特征,包括:从所述传输协议栈中查询所述数据包序列中位于所述已收数据包之后、且被选择性确认的数据包的数量,以作为所述被选择性确认数量特征;根据所述被选择性确认的数据包的位置,确定所述数据包序列中在所述已收数据包之后未被选择性确认的数据包所构成的区间数量,以作为区间数量特征;确定序号最大的所述被选择性确认的数据包和所述已收数据包的序号之间的差值,以作为最大差值数量特征。5.根据权利要求1所述的方法,其特征在于,用于所述位置预测处理的机器学习模型包括决策树模型;所述基于所述网络特征对所述数据包序列进行位置预测处理,以确定所述数据包序列中位于已收数据包之后的最远丢包位置,包括:调用所述决策树模型执行以下处理:基于所述网络特征的多个维度的取值,遍历所述决策树中的多级级联的节点,以确定所述多个维度的取值对应的判断路径,将所述判断路径的最后一级节点中的丢包位置作为最远丢包位置;其中,每个所述节点包括所...
【专利技术属性】
技术研发人员:张霖,刘岩,陈立,陈果,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。