多业务场景的识别方法和决策森林模型的训练方法技术

技术编号:38024035 阅读:10 留言:0更新日期:2023-06-30 10:50
本发明专利技术实施例涉及无线局域网技术领域,公开了一种多业务场景的识别方法和决策森林模型的训练方法。上述多业务场景的识别方法包括:获取待识别业务场景的报文数据的数据流特征;将所述数据流特征输入预先训练好的决策森林模型;所述决策森林模型包括N个决策树,所述决策树用于识别数据流特征的业务场景;所述N为大于0的自然数,所述决策森林模型的训练样本包括多个业务场景的数据流特征;根据所述N个决策树的识别结果,获取所述报文数据的业务场景。本发明专利技术实施例提供的多业务场景的识别方法,可以实现多业务场景的识别,提升用户的使用体验。用体验。用体验。

【技术实现步骤摘要】
多业务场景的识别方法和决策森林模型的训练方法


[0001]本申请实施例涉及无线局域网
,特别涉及一种多业务场景的识别方法和决策森林模型的训练方法。

技术介绍

[0002]业务场景识别算法允许(Wireless Local Area Network,WLAN)接入点和设备感知当前用户正在访问的应用、服务和场景,比如游戏、语音、视频、直播等。然后根据应用、服务和场景的特性,接入点为用户提供不同的WLAN参数配置和服务,能够最大化用户的网络接入体验。例如,优先地发送游戏报文,为用户提供低延时和低卡顿的游戏体验。在这之中,业务场景识别算法作为整个流程的基石,它的性能至关重要。
[0003]目前业务场景识别算法有如下几种:
[0004](1)基于报文的业务场景识别:在专有网络中,设备之间会发送包含了业务场景类型信息的流量包。通过解读这些流量包中的内容,可以实现业务场景识别。
[0005](2)基于访问特征的业务场景识别:特定场景,比如网页浏览或者游戏,会访问特定的端口和IP。通过建立访问特征和业务场景的一一映射库,实现业务场景识别。
[0006](3)基于深度包检测技术的业务场景识别:该方法对于每个场景在流量中携带的特定特征字段进行提取,然后将流量的内容与事先建立的特征库相比较,从而判断当前流量的业务场景。
[0007]然而,上述的基于报文的业务场景识别算法、基于访问特征的业务场景识别算法和基于深度包检测技术的业务场景识别算法只能针对特定的业务场景进行识别,不能实现多业务场景的识别

技术实现思路

[0008]本申请实施例的主要目的在于提出一种多业务场景的识别方法和决策森林模型的训练方法,可以实现多业务场景的识别,提升用户的使用体验。
[0009]为至少实现上述目的,本申请实施例提供了一种多业务场景的识别方法,包括:获取待识别业务场景的报文数据的数据流特征;将所述数据流特征输入预先训练好的决策森林模型;所述决策森林模型包括N个决策树,所述决策树用于识别数据流特征的业务场景;所述N为大于0的自然数,所述决策森林模型的训练样本包括多个业务场景的数据流特征;根据所述N个决策树的识别结果,获取所述报文数据的业务场景。
[0010]为至少实现上述目的,本申请实施例还提供了一种决策森林模型的训练方法,包括:获取训练样本,所述训练样本包括多个业务场景的数据流特征;根据所述训练样本对初始的决策森林模型进行训练,得到训练好的决策森林模型;其中,所述决策森林模型包括N个决策树,所述决策树用于识别数据流特征的业务场景;所述N为大于0的自然数。
[0011]为至少实现上述目的,本申请实施例还提供了一种多业务场景的识别装置,包括:特征获取模块,用于获取待识别业务场景的报文数据的数据流特征;输入模块,用于将所述
数据流特征输入预先训练好的决策森林模型;所述决策森林模型包括N个决策树,所述决策树用于识别数据流特征的业务场景;所述N为大于0的自然数,所述决策森林模型的训练样本包括多个业务场景的数据流特征;场景获取模块,用于根据所述N个决策树的识别结果,获取所述报文数据的业务场景。
[0012]为至少实现上述目的,本申请实施例还提供了一种决策森林模型的训练装置,包括:样本获取模块,用于获取训练样本,所述训练样本包括多个业务场景的数据流特征;训练模块,用于根据所述训练样本对初始的决策森林模型进行训练,得到训练好的决策森林模型;其中,所述决策森林模型包括N个决策树,所述决策树用于识别数据流特征的业务场景;所述N为大于0的自然数。
[0013]为至少实现上述目的,本申请实施例还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的多业务场景的识别方法,或者,执行上述的决策森林模型的训练方法。
[0014]为至少实现上述目的,本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的多业务场景的识别方法,或者,实现上述的决策森林模型的训练方法。
[0015]本申请提出的多业务场景的识别方法,首先获取待识别业务场景的报文数据的数据流特征,将数据流特征输入到预先训练好的决策森林模型中,其中,决策森林模型包括N个决策树,决策树用于识别数据流特征的业务场景,其中,N为大于0的自然数,并且决策森林模型的训练样本包括多个业务场景的数据流特征,根据N个决策树的识别结果,获取报文数据的业务场景。由于决策森林模型的训练样本包括多个业务场景的数据流特征,业务场景的覆盖范围广泛,因此,将获取到的报文数据的数据流特征输入到训练好的决策森林模型中,即可根据决策森林模型中的决策树的识别结果,得到报文数据的业务场景,即实现了多种业务场景的识别,然后根据报文数据的业务场景提供对应的WLAN参数配置和服务,有效地提升了用户的使用体验。
附图说明
[0016]一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标识的元件表示为类似的元件,除非有特别的申明,附图中的图不构成比例限制。
[0017]图1是根据本专利技术一个实施例提供的一种系统架构图;
[0018]图2是根据本专利技术一个实施例提供的一种接入点设备的结构图;
[0019]图3是根据本专利技术一个实施例提供的一种多业务场景的识别方法的流程图;
[0020]图4是根据本专利技术一个实施例提供的一种决策森林模型结构图;
[0021]图5是根据本专利技术另一个实施例提供的一种多业务场景的识别方法的流程图;
[0022]图6是根据本专利技术一个实施例提供的一种决策森林模型的训练方法的流程图;
[0023]图7是根据本专利技术一个实施例提供的一种多业务场景的识别装置的示意图;
[0024]图8是根据本专利技术一个实施例提供的一种决策森林模型的训练装置的示意图;
[0025]图9是根据本专利技术一个实施例提供的一种电子设备的结构示意图。
具体实施方式
[0026]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本申请的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
[0027]本专利技术的一个实施例涉及一种多业务场景的识别方法,应用于接入点设备。本专利技术的实施例的应用场景可以包括但不限于如图1所示的系统架构中,包括:接入点设备和多个用户设备。
[0028]具体地,一个WLAN有至少一个接入点设备,用户设备与接入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多业务场景的识别方法,其特征在于,包括:获取待识别业务场景的报文数据的数据流特征;将所述数据流特征输入预先训练好的决策森林模型;所述决策森林模型包括N个决策树,所述决策树用于识别数据流特征的业务场景;所述N为大于0的自然数,所述决策森林模型的训练样本包括多个业务场景的数据流特征;根据所述N个决策树的识别结果,获取所述报文数据的业务场景。2.根据权利要求1所述的多业务场景的识别方法,其特征在于,所述决策树的识别结果包括识别到的业务场景和所述识别到的业务场景的权重;所述根据所述N个决策树的识别结果,获取所述报文数据的业务场景,包括:根据所述N个决策树的识别结果,将识别到的相同类别的业务场景的权重进行累加,得到识别到的各业务场景的权重累加值;将所述权重累加值最高的业务场景作为所述报文数据的业务场景。3.根据权利要求1所述的多业务场景的识别方法,其特征在于,所述数据流特征包括以下之一或其任意组合:源IP、源端口、目的IP、目标端口、协议类型、最大报文大小、最小报文大小、平均报文大小、报文大小的方差、最大报文交换时间、最小报文交换时间、平均报文交换时间。4.根据权利要求3所述的多业务场景的识别方法,其特征在于,当所述数据流特征包括源IP和/或目的IP,在所述获取待识别业务场景的报文数据的数据流特征后,将所述数据流特征输入预先训练好的决策森林模型之前,还包括:将源IP和/或目的IP的地址转换为二进制数据;将所述二进制数据转化为无符号整形;对转化为无符号整形的所述二进制数据进行小数精度归一化,得到归一化后的用于输入所述决策森林模型的源IP和/或目的IP;当所述数据流特征包括源端口和/或目标端口,在所述获取待识别业务场景的报文数据的数据流特征后,将所述数据流特征输入预先训练好的决策森林模型之前,还包括:对源端口和/或目标端口进行小数精度归一化,得到归一化后的用于输入所述决策森林模型的源端口和/或目标端口。5.根据权利要求3所述的多业务场景的识别方法,其特征在于,当所述数据流特征包括协议类型,在所述获取待识别业务场景的报文数据的数据流特征后,将所述数据流特征输入预先训练好的决策森林模型之前,还包括:根据预设的协议类型与整数的映射关系,将当前获取的协议类型映射到对应的整数,并将所述对应的整数作为输入所述决策森林模型的协议类型。6.根据权利要求1至5中任一项所述的多业务场景的识别方法,其特征在于,在所述根据所述N个决策树的识别结果,获取所述报文数据的业务场景后,还包括:将最近预设时长内的数据流特征,更新至所述训练样本,其中,所述最近预设时长内的数据流特征标定有业务场景,所述最近预设时长内的数据流特征的数据量,与更新前的所述训练样本的数据量相同;根据...

【专利技术属性】
技术研发人员:王子晟张耀东刘昕颖
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1