【技术实现步骤摘要】
本专利技术涉及新闻视频管理领域,特别是涉及一种基于统计的从新闻视频中识别视频主持人的方法。
技术介绍
对于电视台来说,本台的新闻材料有完整的存储管理系统,很容易对一个新闻视频中的一则新闻进行后续使用;但是,其余来源的新闻视频就需要进行拆条处理,即将新闻视频拆分成一个一个单独的新闻以便后续使用。而新闻拆条的关键是快速定位一则新闻的开始和结尾,而要定位一条新闻的开始和结尾是很难的。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于统计的视频主持人识别方法,以方便新闻视频的拆条处理。本专利技术的目的是通过以下技术方案来实现的:一种基于统计的视频主持人识别方法,所述方法包括以下步骤。S1,视频预处理:S101,以帧为单位对视频图像进行解码处理,输出视频帧数据;S102,对视频帧数据进行分组处理,每m帧为一组得到多组三通道图像;S103,通过RGB三通道将每组三通道图像均转化为单通道灰度图像。S2,人脸识别处理:对每组三通道图像的灰度图像进行人脸识别,定位出每个灰 ...
【技术保护点】
一种基于统计的视频主持人识别方法,其特征在于,所述方法包括以下步骤:S1,视频预处理:S101,以帧为单位对视频图像进行解码处理,输出视频帧数据;S102,对视频帧数据进行分组处理,每m帧为一组得到多组三通道图像;S103,通过RGB三通道将每组三通道图像均转化为单通道灰度图像;S2,人脸识别处理:对每组三通道图像的灰度图像进行人脸识别,定位出每个灰度图像中的人脸位置;S3,衣服识别处理:根据人脸位置对人物的衣服进行识别,定位出该人脸人物所穿衣服的衣服位置;S4,相关性分析:S401,通过直方图特征对每组三通道图像的人脸位置区域图像进行相关性分析,对相邻两组三通道图像的人脸 ...
【技术特征摘要】
1.一种基于统计的视频主持人识别方法,其特征在于,所述方法包括以下步骤:
S1,视频预处理:
S101,以帧为单位对视频图像进行解码处理,输出视频帧数据;
S102,对视频帧数据进行分组处理,每m帧为一组得到多组三通道图像;
S103,通过RGB三通道将每组三通道图像均转化为单通道灰度图像;
S2,人脸识别处理:对每组三通道图像的灰度图像进行人脸识别,定位出每个灰度图像中的人脸位置;
S3,衣服识别处理:根据人脸位置对人物的衣服进行识别,定位出该人脸人物所穿衣服的衣服位置;
S4,相关性分析:
S401,通过直方图特征对每组三通道图像的人脸位置区域图像进行相关性分析,对相邻两组三通道图像的人脸位置区域图像提取直方图,并进行均衡化处理;
S402,计算该相邻两组三通道图像的人脸位置区域图像的相关度,判断该两组三通道图像是否相似,并将相似的两组三通道图像连接形成片段;
S5,选取关键帧:
S501:在每个片段中选取一个或多个帧作为关键帧;
S502,根据关键帧的特征,对所有选取出来的关键帧进行相似度分析;
S503,将相似的关键帧归为一类,得到多个类别的关键帧,并统计每个类别中关键帧的数目;
S6,定位视频支持人:根据视频主持人的特征,将符合视频主持人的特征的类别,判定为存在视频主持人的关键帧,并确定出视频主持人在该类别的关键帧中的位置。
2.根据权利要求1所述的一种基于统计的视频主持人识别方法,其特征在于:S502中所述的相似度分析至少包括Hog特征相似分析、Hash指纹相似分析、直方图特征相似分析、多尺度LBP特征相似分析和衣服相似分析中的一种或多种组合;
所述Hog特征相似分析为:将关键帧均分成k个区域,计算每个区域的像素点相关的大小参数γ和角度参数θ,其中,大小参数γ的计算方式为:根据像素点上下左右四个点计算出横向两个像素点的差值a和纵向两个像素点的差值b,根据差值a和差值b两个向量计算出大小参数γ;角度参数θ为差值a和差值b两个向量之间的夹角;将角度参数θ均分为k段,根据每个区域的像素点的大小参数γ和角度参数θ,统计出每个区域中像素点在k段中的分布,对比两个关键帧对应区域的角度参数θ的分布,计算出两个关键帧的差异,差异在一定范围内视为该两个关键帧相似;
所述Hash指纹相似分析为:对每个关键帧进行分区,计算每个区域的均值,将每个区域的均值与该关键帧的均值作比较,根据比较结果再将每个区域二值化,得到该关键帧的Hash指纹,根据两个关...
【专利技术属性】
技术研发人员:谢超平,吴春中,陈晓军,
申请(专利权)人:成都索贝数码科技股份有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。