一种基于深度学习频标识别的视频传输质量时域检测方法技术

技术编号:23405629 阅读:96 留言:0更新日期:2020-02-22 16:53
本发明专利技术公开了一种基于深度学习频标识别的视频传输质量时域检测方法,该方法包括:制作用于检测视频传输时域指标的视频,在视频特定位置标定各视频帧序列号与校验号,作为视频标签,简称频标;训练SSD目标检测网络,把视频帧作为SSD目标检测网络的输入,用于检测频标中各目标及目标框;从检测出的目标及目标框中提取出序列号与校验号,序列号用于定位视频帧、校验号用于校验频标识别是否有误;在一次检测中,同时提取视频传输发送端与接收端的视频帧,并分别输入SSD目标检测网络中,提取各自频标,判断是否有画面冻结、计算画面冻结时间、计算画面延时。

A time domain detection method of video transmission quality based on deep learning frequency scale recognition

【技术实现步骤摘要】
一种基于深度学习频标识别的视频传输质量时域检测方法
本专利技术涉及目标检测领域,尤其涉及一种基于深度学习频标识别的视频传输质量时域检测方法。
技术介绍
视频在传输过程中会因网络状况、信道质量、缓存等种种原因产生接收端画面冻结与画面延迟,画面冻结会影响用户观看视频的体验,而在特定场景如实时视频通话中,画面延迟也需要尽量避免,所以对于视频传输中画面冻结、画面延迟的时域检测就显得很重要。现有的视频传输质量检测很多都是基于对图像质量来评价视频传输质量,而视频传输质量时域检测方面的技术研究多集中在丢包、丢帧与图像失真的联系,以及利用时域图像上下文判断画面冻结。前者无法完全体现视频传输在时域方面的画面冻结与画面延迟性能;而后者难以计算画面冻结时间与画面延迟时间。为此寻找一种能高效、准确、智能地评价视频传输质量的时域检测方法具有重要现实意义。
技术实现思路
为解决上述技术问题,本专利技术的目的是提供一种基于深度学习频标识别的视频传输质量时域检测方法。本专利技术的目的通过以下的技术方案来实现:一种基于深度学习频标识别的视频传本文档来自技高网...

【技术保护点】
1.一种基于深度学习频标识别的视频传输质量时域检测方法,其特征在于,所述方法包括:/nA制作用于检测视频传输时域指标的视频,在视频特定位置标定各视频帧序列号N

【技术特征摘要】
1.一种基于深度学习频标识别的视频传输质量时域检测方法,其特征在于,所述方法包括:
A制作用于检测视频传输时域指标的视频,在视频特定位置标定各视频帧序列号Ns与校验号Nc,作为视频标签;
B训练SSD目标检测网络,把视频帧作为SSD目标检测网络的输入,用于检测频标中各目标及目标框n为检测出目标总数;
C从检测出的及中提取出与用于定位视频帧、用于校验频标识别是否有误;
D在一次检测中,同时提取视频传输发送端与接收端的视频帧,并分别输入SSD目标检测网络中,提取各自频标,判断是否有画面冻结、计算画面冻结时间Tf、计算画面延时Td。


2.如权利要求1所述的基于深度学习频标识别的视频传输质量时域检测方法,其特征在于,所述步骤A中,频标中各字符从左到右水平排列,频标包含序列号Ns与校验号Nc,其中:第i帧的序列号以字符“S”作为开始标志符、Ns,i为i、以字符“C”作为结束标志符;第i帧的校验号以序列号的结束标志符“C”作为开始标志符、Nc,i为数字i各位之和+位数、以字符“E”作为结束标志符;序列号与校验号同行、连续排列,序列号在校验号之前。


3.如权利要求1所述的基于深度学习频标识别的视频传输质量时域检测方法,其特征在于,所述步骤B中,SSD目标检测网络的数据集为部分视频帧图像,制作数据集时标注图像频标中各元素及所在区域,各元素类别包括字符“S”、“C”、“E”、“0”、“1”、“2”、“3”、“4”、“5”、“6”、“7”、“8”、“9”,包括背景在内,该网络共14个目标检测类别;训练与检测时把视频帧输入SSD目标检测网络中计算,得到候选结果,对候选结果作非极大值抑制,排除对同一目标的重复检测,并按目标框中心横坐标从小到大...

【专利技术属性】
技术研发人员:刘桂雄蒋晨杰
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1