一种流量检测方法和流量检测设备技术

技术编号:22104864 阅读:38 留言:0更新日期:2019-09-14 04:22
本申请公开一种流量检测方法,包括:获取流量采集设备在第一时间段内采集到的多个报文,多个报文包括第一数据流以及至少一个第二数据流中的报文;根据多个报文,确定目标特征集合,目标特征集合包括多个报文对应的多流特征,多流特征包括多个报文的大小的统计参数;根据目标特征集合,以及目标特征集合与业务类型的对应关系,确定在第一时间段内第一数据流对应的业务类型。上述流量检测方法能够获得更多特征,通过更多的特征比对能够提高流量检测的准确率。本申请还公开了一种流量检测设备,能够实现上述流量检测方法。

A Flow Detection Method and Flow Detection Equipment

【技术实现步骤摘要】
一种流量检测方法和流量检测设备
本申请涉及通信领域,尤其涉及一种流量检测方法和流量检测设备。
技术介绍
流量识别一直是互联网数据分析中的重要研究领域,具有广泛的应用场景。流量识别技术是做流量精细化管理和体验质量评估保障的基础,可提供用户级和业务级的体验质量监控和优化。流量识别技术是运营商做精准运营的基础,可提供OTT用户画像、精准营销等服务;此外,流量识别在网络安全等其他场景也具有重要价值。而实现上述的种种服务,则需要识别流量中的业务类型,因为不同的业务类型所需要的带宽、网络延时等网络质量指标的等级要求不同,而指标的评估和优化需要细化到业务类型的粒度。不同的业务类型可以包括如页面流量、视频观看、网页浏览、Speedtest测速、Youtube在线视频观看、文件传输、网络电视、网络电台以及即时通信等等。例如数据流的流量吞吐率随时间的变化,与该数据流的用户在不同时刻做的不同类型的业务有关,不同业务存在明显的吞吐率差异,因此抛开业务类型谈指标,是不可能精确评估当前的网络质量指标(这里以吞吐率为例)是否达标,以及用户做业务的体验质量是否正常,而网络流量识别可以支持从业务类型的角度分析指标和体本文档来自技高网...

【技术保护点】
1.一种流量检测方法,其特征在于,所述方法包括:获取流量采集设备在第一时间段内采集到的多个报文,所述多个报文包括第一数据流以及至少一个第二数据流中的报文,所述第一数据流与所述至少一个第二数据流为属于同一用户的数据流;根据所述多个报文,确定目标特征集合,所述目标特征集合包括所述多个报文对应的多流特征,所述多流特征包括所述多个报文的大小的统计参数;根据所述目标特征集合,以及所述目标特征集合与业务类型的对应关系,确定在所述第一时间段内所述第一数据流对应的业务类型。

【技术特征摘要】
1.一种流量检测方法,其特征在于,所述方法包括:获取流量采集设备在第一时间段内采集到的多个报文,所述多个报文包括第一数据流以及至少一个第二数据流中的报文,所述第一数据流与所述至少一个第二数据流为属于同一用户的数据流;根据所述多个报文,确定目标特征集合,所述目标特征集合包括所述多个报文对应的多流特征,所述多流特征包括所述多个报文的大小的统计参数;根据所述目标特征集合,以及所述目标特征集合与业务类型的对应关系,确定在所述第一时间段内所述第一数据流对应的业务类型。2.根据权利要求1所述的方法,其特征在于,所述多流特征还包括所述多个报文对应的接收时间间隔的统计参数和所述多个报文的传输速率的统计参数中的至少一种。3.根据权利要求1所述的方法,其特征在于,所述第一时间段与所述流量采集设备在第二时间段内采集到的多个报文的统计参数相关。4.根据权利要求1所述的方法,其特征在于,所述获取所述流量采集设备在所述第一时间段内采集到的多个报文,包括:获取所述流量采集设备在第二时间段内采集到的多个报文,在所述第二时间段内采集到的多个报文包括所述第一数据流以及所述至少一个第二数据流中的报文;在所述流量采集设备在所述第二时间段内接收的最后一个所述第一数据流的报文的接收时刻与所述第二时间段的结束时刻之间的时间差小于预设阈值的情况下,获取所述流量采集设备在所述第三时间段内采集到的多个报文,其中,所述第二时间段与所述第三时间段之和为所述第一时间段。5.根据权利要求1所述的方法,其特征在于,所述获取流量采集设备在第一时间段内采集到的多个报文,包括:获取所述流量采集设备在第二时间段内采集到的多个报文,在所述第二时间段内采集到的多个报文包括所述第一数据流以及所述至少一个第二数据流中的报文;在所述流量采集设备在所述第二时间段内接收的数据总量大于预设数据量的情况下,并获取所述流量采集设备在所述第三时间段内采集到的多个报文,其中,所述第二时间段与所述第三时间段之和为所述第一时间段。6.根据权利要求1所述的方法,其特征在于,所述根据所述目标特征集合,以及所述目标特征集合与业务类型的对应关系,确定在所述第一时间段内所述第一数据流对应的业务类型包括:根据所述目标特征集合,从特征库中查找出第一特征集合,所述第一特征集合为与所述目标特征集合的相似度最高的特征集合;根据所述第一特征集合与业务类型的对应关系,确定在所述第一时间段内所述第一数据流对应的业务类型,所述在所述第一时间段内所述第一数据流对应的业务类型与所述第一特征集合对应的业务类型相同。7.根据权利要求1所述的方法,其特征在于,所述目标特征集合还包括在所述第一时间段内采集到的所述第一数据流的报文对应的单流特征,所述单流特征包括所述采集到的所述第一数据流的报文的大小的统计参数。8.根据权利要求7所述的方法,其特征在于,所述单流特征还包括所述采集到的所述第一数据流的报文的接收时间间隔的统计参数和传输速率的统计参数中的至少一种。9.根据权利要求1至8中任一项所述的方法,其特征在于,所述目标特征集合还包括在所述第一时间段内采集到的所述第一数据流的事务的特征,所述事务包括多个报文,所述事务包括的多个报文为一请求和与所述请求对应的至少一个响应,所述事务的特征包括所述事务包括的多个报文的大小的统计参数。10.根据权利要求9所述的方法,其特征在于,所述事务的特征还包括所述事务包括的多个报文所对应的接收时间间隔的统计参数,以及所述事务包括的多个报文的传输速率的统计参数。11.根据权利要求1至10中任一项所述的方法,其特征在于,所述统计参数包括平均值、最大值、最小值、标准差、分位数、峰度、偏度和频谱参数中的至少一种。12.根据权利要求7到11任一所述的方法,其特征在于,所述方法还包括:通过机器学习算法训练多个新增样本和多个历史样本,以更新所述特征库中特征集合与业务类型的对应关系,所述多个新增样本包括所述第一时间段内第一数据流对应的样本,所述第一数据流对应的样本包括所述第一数据流的多流特征以及业务类型。13.根据权利要求12所述的方法,其特征在于,所述多个新增样本中,包括至少一个第一新增样本,所述第一新增样本对应所述特征库中的一特征集合,其中,所述第一新增样本中包括一组高置信的特征,该组高置信的特征与所述特征库中的一个特征集合的相似度满足预设条件,以及所述第一新增样本中包括的业务类型与所述第一新增样本对应的特征集合所对应的业务类型相同。14.根据权利要求12或13所述的方法,其特征在于,所述多个新增样本中,包括至少一个第二新增样本,所述方法还包括:获取流量采集设备采集到的一数据流在一个时间段内对应的服务器标识,所述服务器标识包括一服务器的网络互连协议IP地址和所述服务器的名称;根据所述服务器标识与业务类型的对应关系,确定所述数据流的业务类型;保存所述数据流对应的第二新增样本,所述第二新增样本中包括所述数据流的业务类型以及在所述时间段内的多流特征。15.一种流量检测方法,其特征在于,所述方法包括:获取流量采集设备在第一时间段内采集到的多个报文,所述多个报文包括在所述第一时间段内第一数据流中至少一个事务的报文;根据所述多个报文,确定目标特征集合,所述目标特征集合包括在所述第一时间段内采集到的所述第一数据流的事务的特征,所述事务包括的多个报文为一请求和与所述请求对应的至少一个响应,所述事务的特征包括所述事务包括的多个报文的大小的统计参数;根据所述目标特征集合,以及所述目标特征集合与业务类型的对应关系,确定在所述第一时间段内所述第一数据流对应的业务类型。16.根据权利要求15所述的方法,其特征在于,所述事务的特征还包括所述事务包括的多个报文所对应的接收时间间隔的统计参数和所述事务包括的多个报文的传输速率的统计参数中的至少一种,所述多个报文对应的接收时间间隔为所述多个报文中,任意两个接收时间相邻的报文之间的接收时间的间隔。17.根据权利要求15所述的方法,其特征在于,所述方法还包括:根据第一事务包括的多个报文,确定所述第一事务的特征,所述第一事务为所述第一数据流的事务中的任意一个事务;根据所述第一事务的特征以及所述第一事务的特征与业务类型的对应关系,确定所述第一事务对应的业务类型。18.根据权利要求15至17中任一项所述的方法,其特征在于,所述统计参数包括平均值、最大值、最小值、标准差、分位数、峰度、偏度或频谱参数中的至少一种。19.根据权利要求15至17中任一项所述的方法,其特征在于,所述方法还包括:通过机器学习算法训练多个新增样本和多个历史样本,以更新在特征库中特征集合与业务类型的对应关系,所述多个新增样本包括在所述第一时间段内所述第一数据流的事务对应的样本,所述第一数据流的事务对应的样本包括所述第一数据流的事务的特征以及业务类型。20.根据权利要求19所述的方法,其特征在于,所述多个新增样本中,包括至少一个第一新增样本,所述第一新增样本对应所述特征库中的一特征集合,其中,所述第一新增样本中包括一组高置信的特征,该组高置信的特征与所述特征库中的一个特征集合的相似度满足预设条件,以及所述第一新增样本中包括的业务类型与所述第一新增样本对应的特征集合所对应的业务类型相同。21.根据权利要求19或20所述的方法,其特征在于,所述多个新增样本中,包括至少一个第二新增样本,所述方法还包括:获取流量采集设备在所述第一时间段内采集到的所述第一数据流的事务对应的服务器标识,所述服务器标识包括一服务器的网络互连协议IP地址和所述服务器的名称;根据所述服务器标识与业务类型的对应关系,确定所述第一数据流的事务的业务类型;保存在第一时间段内所述第一数据流的事务对应的第二新增样本,所述第二新增样本包括所述第一数据流的事务的业务类型以及所述第一数据流的事务的特征,所述事务的特征包括至少一个统计参数。22.一种样本训练方法,其特征在于,包括:识别一个时间段内多条数据流的业务类型,以得到多个新增样本;通过机器学习算法训练更新后的样本集合,以得到更新后的对应关系集合,所述更新后的对应关系集合包括多条映射关系,所述映射关系为特征集合与业务类型之间的映射关系;所述更新后的样本集合包括多个新增样本和多个历史样本,其中,所述更新后的样本集合中的每个样本包括一业务类型以及多个特征,所述多个特征包括多流特征,单流特征和事务的特征中的至少一种,所述多流特征,单流特征和事务的特征都包括至少一个统计参数。23.根据权利要求22所述的方法,其特征在于,所述多个新增样本中,包括至少一个第一新增样本,所述第一新增样本对应所述特征库中的一特征集合,其中,所述第一新增样本中包括一组高置信的特征,该组高置信的特征与所述特征库中的一个特征集合的相似度满足预设条件,以及所述第一新增样本中包括的业务类型与所述第一新增样本对应的特征集合所对应的业务类型相同。24.根据权利要求22所述的方法,其特征在于,所述多个新增样本中,包括至少一个第二新增样本,所述方法还包括:获取流量采集设备采集到的一数据流在一个时间段内对应的服务器标识,所述服务器标识包括一服务器的网络互连协议IP地址和所述服务器的名称;根据所述服务器标识与业务类型的对应关系,确定所述数据流的业务类型;保存在所述时间段内所述数据流对应的第二新增样本,所述第二新增样本中包括所述数据流的业务类型以及所述数据流的多流特征。25.一种流量检测设备,其特征在于,包括:获取...

【专利技术属性】
技术研发人员:罗涛郭建伟彭柳青
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1