【技术实现步骤摘要】
一种基于HTTP/3传输特性的加密视频识别方法
[0001]本专利技术涉及一种基于HTTP/3传输特性的加密视频识别方法,属于计算机网络安全
技术介绍
[0002]随着通信技术的进步和移动互联网的发展,网络交互场景越来越丰富,视频网络流量在互联网中的比重不断增加。互联网流量检测机构Sandvine的2023年全球互联网现象报告显示,视频流量在2022年增长了24%,现已相当于所有互联网流量的65%。与此同时,为了保护用户安全和隐私,互联网各大视频平台对视频流量逐步进行了加密传输。基于此背景,一些含有不当内容的有害视频极易被快速传播并渗透社会生活各个方面,因此,对互联网上传输的有害视频进行快速识别是对网络安全空间有效管理的必要前提。
[0003]现有对视频内容进行识别的方法大多需要通过视频平台获取视频文件。视频平台在进行内容审核时,往往采用人工审核或人工智能(Artificial Intelligence,AI)识别两种方式。然而,人工审核工作量大、耗时长,AI识别受硬件和识别技术限制,成本高,这些原因导致小型视频平台无法负担视频审核的费用。此外,由于视频跨平台传播速度快,这类基于视频平台的管理方式需要多个平台高效协作,导致难以部署,实用性差。
[0004]近年也有根据视频传输的网络流量识别出有害视频的方法,这类方法不需要多方协作,只要在主干接入点部署流量采集点就可以应用,具有很强的实用性。这类方法需要事先建立公害视频特征库,对网络进行监测时,通过对流量的分析提取被传输的视频特征,与公害视频特 ...
【技术保护点】
【技术特征摘要】
1.一种基于HTTP/3传输特性的加密视频识别方法,其特征在于,该方法包括以下步骤:步骤(1)下载所需识别的视频的元信息并提取其中的音视频明文分段信息,打上内容标签,从而获取视频明文指纹,构建视频明文指纹库,步骤(2)在采集设备上,抓取视频播放时的加密传输数据,步骤(3)对步骤(2)采集的流量数据,根据五元组(源IP地址、目的IP地址、源端口,目的端口,传输层协议)筛选流量数据大于64KB的HTTP/3加密视频数据流并进行分块处理,提取出音视频块及其长度特征,步骤(4)对步骤(3)提取出的音视频块进行特征提取并记录特征数据,包括控制信息特征STREAM_ID
flag
、MINUS
flag
和数据传输特征PACKET
count
、STREAM
len
,步骤(5)根据步骤(4)提取出的特征,将音视频块传输前对应的音视频片段组合长度L
fit
作为音视频块密文长度的标签,使用回归模型对步骤(3)中提取的音视频块的长度进行修正得到修正密文长度CAVCL(Corrected Audio/Video Combination Length),对HTTP/3加密数据流中的所有音视频块进行修正处理,得到的CAVCL序列称为CAVCLS(Corrected Audio/Video Combination Length Serials),步骤(6)对(5)中得到的CAVCLS,将其与(1)中构建的明文指纹库进行匹配,得到视频内容标题。2.根据权利要求1所述的一种基于HTTP/3传输特性的加密视频识别方法,其特征在于,在步骤(1)中,下载所需识别的视频的元信息并提取其中的音视频明文分段信息,打上内容标签,从而获取视频明文指纹,构建视频明文指纹库方法如下:(1.1)给定需要识别的视频标题和URL列表,(1.2)下载给定视频的响应JSON文件,提取索引片段在整个音视频中的所在范围,并根据该范围下载音视频索引片段,(1.3)从音视频索引片段中提取索引信息,获取给定视频的音视频明文指纹信息并标记内容标签,如视频标题、分辨率信息以及明文标号,(1.4)对于步骤(1.1)中给定的视频,使用(1.2)和(1.3)相同的方法进行明文指纹提取,建立视频明文指纹数据库。3.根据权利要求1所述的一种基于HTTP/3传输特性的加密视频识别方法,其特征在于,在步骤(2)中,在采集设备上,抓取视频播放时的加密传输数据方法如下:采集设备特定接口的加密传输数据,存为报文数据文件。4.根据权利要求1所述的一种基于HTTP/3传输特性的加密视频识别方法,其特征在于,在步骤(3)中,对步骤(2)采集的流量数据,根据五元组即源IP地址、目的IP地址、源端口,目的端口,传输层协议筛选流量数据大于64KB的HTTP/3加密视频数据流并进行分块处理,提取出音视频块及其长度特征方法如下:(3.1)根据五元组即源IP地址,源端口,目的IP地址,目的端口,传输层协议,提取HTTP/3双向流,并设置阈值64KB筛选出HTTP/3加密视频流量,(3.2)对于(3.1)提取出的HTTP/3加密视频流,提取出客户端向服务器发送的长度为1000字节左右的数据包作为请求报文,将请求报文作为分割点,两次请求报文之间的一条Stream的流量数据被认定为一个音视频块,(3.3)对于步骤(3.1)中提取出的HTTP/3加密视频流量,使用(3.2)相同的方法分割出
多个音视频块,(3.4)对于步骤(3.2)分割出的音视频块,将其中包含的所有响应数据包的UDP载荷长度相加得到这个音视频块的密文长度,(3.5)对于步骤(3.3)分割出的每个音视频块,使用(3.4)相同的方法得到(3.1)中HTTP/3加密视频流的音视频块密文长度特征序列。5.根据权利要求1所述的一种基于HTTP/3传输特性的加密视频识别方法,其特征在于,在步骤(4)中,对步骤(3)提取出的音视频块进行特征提取并记录特征数据,包括控制信息特征STREAM_ID
flag
、MINUS
flag
和数据传输特征PACKET
count
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。