一种加密VoIP网络流量所使用语言的识别方法技术

技术编号：21835854 阅读：39 留言：0更新日期：2019-08-10 19:13

本发明专利技术公开了一种加密VoIP网络流量所使用语言的识别方法，本发明专利技术属于网络安全技术领域，包括建模步骤、采集处理步骤和比对识别步骤，建模步骤通过使用不同语言形成的VoIP包长序列特征建立参考语言包长概率分布模型；采集处理步骤采集待识别的VoIP网络流量所使用的语言数据并进行预处理，所述预处理是将语言数据按照语言类型分类形成目标语言包长概率分布模型；比对识别步骤将采集处理步骤中形成的目标语言包长概率分布模型与建模步骤中建立的参考语言包长概率分布模型逐一进行比对，选取与目标语言包长概率分布模型相似度最高的参考语言包长概率分布模型对应的语言作为结构进行输出。

A Language Recognition Method for Encrypting VoIP Network Traffic

全部详细技术资料下载

【技术实现步骤摘要】
一种加密VoIP网络流量所使用语言的识别方法
本专利技术属于计算机网络安全
，具体涉及基于网络加密VoIP数据流量中所使用的语言分析判别方法。
技术介绍
网络流量分析识别可检测非法行为、实施访问控制、资源分配及提供服务质量QoS保障等，是网络运行管理和安全的重要支撑技术。传统流量分析通过IP地址和主机名、通信端口或整个数据包等特征对流量进行刻画、监管及预测趋势。流量数据加密后，对数据包内容检测的DPI(DeepPacketInspection)技术受到挑战。目前的互联网使用报告显示超半数Internet流量已加密，加密流量的分析识别受到网络安全研究领域广泛关注。网络巨头思科公司2017年发布的加密流量分析器(ETA:EncryptedTrafficAnalytics)，可在不解密流量前提下检测网络传输层中存在的恶意软件。其检测方法主要是对未加密的连接建立的初始阶段进行分析，同时使用加密后数据包特征(包大小、包到达间隔时间等)进行检测识别，准确率很高且能在线检测。常用的加密协议如开放的标准框架IPsec：用于在网络层提供认证、加密和数据完整性服务；传输层加密TLS：基于SSLv3在TCP层提供传输层安全，通过数字证书提供机密性、数据完整性、不可抵赖及重放保护等安全服务，广泛用于HTTP，FTP，SMTP及VoIP中。现有技术对VoIP传输提出的几种加密方案，如基于IPSec的VoIP，该方案加密开销大引入较大延迟，不被接受；美国国家标准技术局(NIST)支持的安全RTP(SRTP)协议，该协议对RTP进行扩展，为应用提供了机密性、身份认证和完整性服务，...

【技术保护点】
1.一种加密VoIP网络流量所使用语言的识别方法，其特征在于，包括以下步骤：建模步骤，通过使用不同语言形成的VoIP包长序列特征建立参考语言包长概率分布模型；采集处理步骤，采集待识别的VoIP网络流量所使用的语言数据并进行预处理，所述预处理是将语言数据按照语言类型分类形成目标语言包长概率分布模型；比对识别步骤，将采集处理步骤中形成的目标语言包长概率分布模型与建模步骤中建立的参考语言包长概率分布模型逐一进行比对，选取与目标语言包长概率分布模型相似度最高的参考语言包长概率分布模型对应的语言作为结构进行输出。

【技术特征摘要】
1.一种加密VoIP网络流量所使用语言的识别方法，其特征在于，包括以下步骤：建模步骤，通过使用不同语言形成的VoIP包长序列特征建立参考语言包长概率分布模型；采集处理步骤，采集待识别的VoIP网络流量所使用的语言数据并进行预处理，所述预处理是将语言数据按照语言类型分类形成目标语言包长概率分布模型；比对识别步骤，将采集处理步骤中形成的目标语言包长概率分布模型与建模步骤中建立的参考语言包长概率分布模型逐一进行比对，选取与目标语言包长概率分布模型相似度最高的参考语言包长概率分布模型对应的语言作为结构进行输出。2.如权利要求1所述的一种加密VoIP网络流量所使用语言的识别方法，其特征在于：所述参考建模步骤，是将已知的参考通话语言VoIP网络流量数据用Speex编解码器窄带模式，按照采集处理步骤中预处理的方法，将数据包预处理后形成包长的三维时间序列(Si，Sj，Sk)，作为参考语言包长概率模型的一个样本点；统计三维时间序列(Si，Sj，Sk)中所有样本点在整个序列中发生的频率作为概率的估计值，形成参考样本点的概率分布模型，即基于包长的参考语言的概率分布模型。3.如权利要求1所述的一种加密VoIP网络流量所使用语言的识别方法，其特征在于：采集处理步骤中，采集待识别的VoIP网络流量所使用的语言数据后，先对语言数据除杂，去除无关流量数据，仅保留其中的VoIP加密网络流量数据用于数据包长特征提取。4.如权利要求1或3所述的一种加密VoIP网络流量所使用语言的识别方法，其特征在于：所述预处理，先确认所述VoIP加密网络流量数据在UDP层上是否使用SRTP协议加密，并确认所使用的SRTP协议是否使用padding填充，对SRTP协议中使用了padding填充的VoIP加密网络流量数据扣除其填充字节长度；然后使用抓包软件读取UDP层数据包长度，扣除固定的UDP包头...

【专利技术属性】
技术研发人员：周琨，汪文勇，唐勇，黄鹂声，张骏，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人