当前位置: 首页 > 专利查询>济南大学专利>正文

互联网游戏视频流量的识别方法、系统、设备及介质技术方案

技术编号:21309801 阅读:54 留言:0更新日期:2019-06-12 11:15
本公开公开了互联网游戏视频流量的识别方法、系统、设备及介质,采用单样本高斯分布重采样算法对互联网游戏视频流量训练集的特征数据集进行采样处理,实现训练集中正样本和负样本的数量均衡,最后得到优化后的训练集;将优化后的训练集的特征输入到分类模型中,对分类模型进行训练;得到训练好的分类模型;采集待测试互联网视频,对待测试互联网视频进行特征提取,对提取的特征进行筛选得到待测试的特征数据集;将待测试的特征数据集输入到训练好的分类模型中;输出互联网游戏视频流量的识别结果。

Identification Method, System, Equipment and Media of Video Traffic in Internet Games

The present disclosure discloses the identification method, system, equipment and media of video traffic of Internet games. The feature data set of the video traffic training set of Internet games is sampled and processed by single sample Gauss distribution resampling algorithm to achieve the balance of positive and negative samples in the training set, and finally the optimized training set is obtained. The feature of the optimized training set is input into the sub-set. In the class model, we train the classification model; get the trained classification model; collect the Internet video to be tested, extract the features of the Internet video to be tested, and filter the extracted features to get the feature data set to be tested; input the feature data set to the trained classification model; output the recognition results of the Internet Game Video traffic.

【技术实现步骤摘要】
互联网游戏视频流量的识别方法、系统、设备及介质
本公开涉及机器学习和数据挖掘领域,特别是涉及互联网游戏视频流量的识别方法、系统、设备及介质。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:近年来,互联网中的视频流量呈现爆发式的增长。根据思科的报告,82%的网络流量是由视频应用产生。大量的视频流量给网络的管理带来了沉重的负担。与此同时,大量的不良视频在网络中传播,危害了社会的稳定,特别对于青少年来说,沉迷于游戏视频严重影响身心的健康发展。因此如何高效的识别出游戏视频和管理互联网中的视频流量成为了一个亟待解决的问题。在计算机视觉方面,研究人员通常提取关键帧,图片颜色和形状等来识别视频内容。图像层面的视频内容识别需要理解高层语义,并且处理的是静态的和完整的数据,这就导致了较低的实时性。另外实时的视频流量导致很难收集完整的视频数据。因此很难将传统的视频内容分析技术应用到互联网视频流量识别中。对于大量的互联网中的视频流量,游戏视频流量只是占据了一小部分,即存在类别不平衡问题。在这种不平衡数据集中,本文档来自技高网...

【技术保护点】
1.互联网游戏视频流量的识别方法,其特征是,包括:采用单样本高斯分布重采样算法对互联网游戏视频流量训练集的特征数据集进行采样处理,实现训练集中正样本和负样本的数量均衡,最后得到优化后的训练集;将优化后的训练集的特征输入到分类模型中,对分类模型进行训练;得到训练好的分类模型;采集待测试互联网视频,对待测试互联网视频进行特征提取,对提取的特征进行筛选得到待测试的特征数据集;将待测试的特征数据集输入到训练好的分类模型中;输出互联网游戏视频流量的识别结果。

【技术特征摘要】
1.互联网游戏视频流量的识别方法,其特征是,包括:采用单样本高斯分布重采样算法对互联网游戏视频流量训练集的特征数据集进行采样处理,实现训练集中正样本和负样本的数量均衡,最后得到优化后的训练集;将优化后的训练集的特征输入到分类模型中,对分类模型进行训练;得到训练好的分类模型;采集待测试互联网视频,对待测试互联网视频进行特征提取,对提取的特征进行筛选得到待测试的特征数据集;将待测试的特征数据集输入到训练好的分类模型中;输出互联网游戏视频流量的识别结果。2.如权利要求1所述的方法,其特征是,所述互联网游戏视频流量训练集的特征数据集的获取步骤为:采集互联网游戏视频和互联网非游戏视频,将互联网游戏视频视为正样本,将互联网非游戏视频视为负样本;利用正样本和负样本做十折交叉验证得到训练集和验证集;对训练集中每个样本进行特征提取,对提取的特征进行筛选,得到训练集的特征数据集。3.如权利要求1所述的方法,其特征是,对训练集中每个样本进行特征提取,具体是指对训练集中每个样本进行字节码分布特征提取。4.如权利要求3所述的方法,其特征是,字节码分布特征,是指:TCP流的256个字节值中每个字节值出现的频率。5.如权利要求3所述的方法,其特征是,字节码分布特征的提取方式为:首先计算TCP流中每个数据包256个字节值的每个字节值出现的次数,然后统计流中每个字节值出现的次数,最后计算流中256个字节值的每个字节值出现的频率。6.如权利要求2所述的方法,其特征是,所述对提取的特征进行筛选,具体是通过CfsSubsetEval特征选择算法对256维的字节码分布特征进行筛选。7.如权利...

【专利技术属性】
技术研发人员:彭立志谢羽茜邓瀚浡陈贞翔
申请(专利权)人:济南大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1