一种终端类型的识别方法及装置制造方法及图纸

技术编号:27880057 阅读:32 留言:0更新日期:2021-03-31 01:13
本申请提供一种终端类型的识别方法及装置,该方法包括:获取待识别终端在第一指定时间段内产生的流量数据;对流量数据进行特征提取,得到流量特征数据,其中,该流量特征数据包括:待识别终端使用的协议数据和待识别终端的流量行为数据;将流量特征数据输入至训练好的分类模型进行终端类型识别,得到待识别终端的终端类型,其中,训练好的分类模型为基于各样本终端的样本流量数据,对初始的分类模型进行训练得到的。本申请实施例可提高识别准确率。

【技术实现步骤摘要】
一种终端类型的识别方法及装置
本申请涉及通信
,尤其涉及一种终端类型的识别方法及装置。
技术介绍
终端识别技术是网络中最具有挑战性的任务之一。目前,通常采用以下几种方式实现终端识别:第一种方式:通过识别媒体访问控制(MediaAccessControl,MAC)地址中的前六位信息(即,MAC组织唯一表示符(OrganizationallyUniqueIdentifier,OUI)),来识别终端的生产厂商。第二种方式:通过识别终端发起的动态主机分配协议(DynamicHostConfigurationProtocol,DHCP)请求中的选项(option)字段,来识别终端的操作系统。第三种方式:通过识别终端发出的超文本传输协议(HypertextTransferProtocol,HTTP)请求中的用户代理(User-Agent)字段,来识别终端的终端类型。但是,在上述第一种方式中,仅能识别出终端的厂商,无法识别出终端的具体类型,进而导致识别精度较差;在上述第二种方式中,仅能识别出终端的操作系统,仍然无法识别出本文档来自技高网...

【技术保护点】
1.一种终端类型的识别方法,其特征在于,所述方法包括:/n获取待识别终端在第一指定时间段内产生的流量数据;/n对所述流量数据进行特征提取,得到流量特征数据,其中,所述流量特征数据包括:所述待识别终端使用的协议数据和所述待识别终端的流量行为数据;/n将所述流量特征数据输入至训练好的分类模型进行终端类型识别,得到所述待识别终端的终端类型,其中,所述训练好的分类模型为基于各样本终端的样本流量数据,对初始的分类模型进行训练得到的。/n

【技术特征摘要】
1.一种终端类型的识别方法,其特征在于,所述方法包括:
获取待识别终端在第一指定时间段内产生的流量数据;
对所述流量数据进行特征提取,得到流量特征数据,其中,所述流量特征数据包括:所述待识别终端使用的协议数据和所述待识别终端的流量行为数据;
将所述流量特征数据输入至训练好的分类模型进行终端类型识别,得到所述待识别终端的终端类型,其中,所述训练好的分类模型为基于各样本终端的样本流量数据,对初始的分类模型进行训练得到的。


2.根据权利要求1所述的方法,其特征在于,通过以下方式获取待识别终端在第一指定时间段内产生的流量数据:
通过探针设备获取待识别终端在第一指定时间段内产生的流量数据。


3.根据权利要求1或2所述的方法,其特征在于,所述训练好的分类模型为随机森林模型或者支持向量机SVM模型;
所述方法还包括:
通过以下方式训练得到所述训练好的分类模型:
获取各样本终端在第二指定时间段内产生的样本流量数据;
对所述样本流量数据进行特征提取,得到样本流量特征数据,每条样本流量特征数据包括对应的样本终端的样本协议数据和样本流量行为数据;
将所述样本流量特征数据输入至初始的分类模型进行终端类型识别,得到每个样本终端对应的预测终端类型的概率值;
根据得到的预测终端类型的概率值与设定的概率值之间的误差,对所述初始的分类模型的参数进行调整,直到收敛,得到所述训练好的分类模型。


4.根据权利要求1所述的方法,其特征在于,所述待识别终端使用的协议数据包括以下数据中的至少一种:
超文本传输协议HTTP请求中的用户代理User-Agent字段、动态主机分配协议DHCP请求中的选项Option字段和应用协议数据中的至少一种。


5.根据权利要求1所述的方法,其特征在于,所述待识别终端的流量行为数据包括以下数据中的至少一种:
所述待识别终端在所述第一指定时间段内的会话总数、外网连接次数、内网连接次数、所述终端在所述第一指定时间段内传输的数据包的总数量、所述终端在所述第一指定时间段内传输的数据包的总大小和在所述第一指定时间段内所述终端所通信的目的设备的IP地址所属的网段。


6.一种终端类型的识别装置,其...

【专利技术属性】
技术研发人员:刘恒胜
申请(专利权)人:新华三技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1