一种视频分割方法及系统技术方案

技术编号:16401545 阅读:134 留言:0更新日期:2017-10-20 07:36
本发明专利技术提供了一种视频分割方法,包括:对所述目标视频流进行场景分割,识别每一个视频场景中是否存在人脸图像和/或人脸的五官特征,获取该视频场景中包含的人脸图片集及所述人脸图片集对应的服装图片集;分别对所述人脸图片集及所述服装图片集进行聚类分析,当得到的聚类分析结果小于预设的阈值时,判定该视频场景为所述目标视频流的分割点,依据各个作为分割点的视频场景对所述目标视频流进行分割。上述的方法,直接判断对目标视频进行分割后的每一个场景是否为所述目标视频的分割点,将满足条件的视频场景作为分割点对所述目标视频流进行分割,不需要建立样本库,避免了需要定期的更新播音员的声音或者图像的样本库中样本特征的问题。

A video segmentation method and system

The present invention provides a video segmentation method, including segmentation of the target video stream, recognition of facial features the existence of face image and / or face each video scene, the video contains scenes in the face image set and the set of face images corresponding to the clothing images respectively; the face image sets and the set of garment image clustering analysis, clustering analysis results obtained when the threshold is less than a preset time, determine the video scene segmentation points for the target video stream, according to each video scene segmentation as the segmentation of the target point of the video stream. The method of direct judgment every scene segmentation of the target video is the target video segmentation, video scene will meet the conditions as the dividing point of the target video stream segmentation, does not need to set up a sample database, avoiding the need for regular updates of the sample feature database announcer the sound or video in.

【技术实现步骤摘要】

本专利技术涉及视频处理领域,尤其涉及一种视频分割方法和系统。
技术介绍
如今,伴随着互联网技术和信息技术飞速发展,为了满足用户多样化的获取新闻资讯需求,新闻视频以其直观,形象、生动的播放特点,收到了越来越多的用户的欢迎。但新闻视频中通常穿插有播音员的镜头,会降低用户获取信息的速度。专利技术人经过研究发现,现有技术中,为了获取新闻视频中的新闻信息,对新闻视频中播音员镜头的处理方式为播音员的声音或者播音员的图像建立一个样本库,通过将新闻视频中的每一帧视频图像的音频或者影响与样本库比对,将匹配成功的视频图像作为新闻视频的分割点,进行分割,上述的方法是基于播音员音频或者影像的样本库来实现的,因此,需要定期的更新播音员的声音或者图像的样本特征。
技术实现思路
有鉴于此,本专利技术提供了一种视频分割方法,用以解决现有技术中的视频分割方法需要定期的更新播音员的声音或者图像的样本特征的问题。具体方案如下:一种视频分割方法,其特征在于,包括:当接收到用户对目标视频流的分割请求时,获取组成所述目标视频流的每一帧视频图像;将所述每一帧视频图像转换为预定格式的视频图片;按所述目标视频流的播放顺序,依次对存在相邻关系的前后两帧视频图片进行场景识别,识别出所述目标视频流中包含的至少两个视频场景;按预设的识别规则,识别每一个视频场景中是否存在人脸图像和/或人脸的五官特征;对于任意一个存在人脸图像和/或人脸的五官特征的视频场景,获取该视频场景中包含的人脸图片集及所述人脸图片集对应的服装图片集;分别对所述人脸图片集及所述服装图片集进行聚类分析,获得聚类分析结果;并在所述聚类分析结果对应的聚类值小于预设阈值时,按预设的判定规则,判定该视频场景为所述目标视频流的分割点;依据各个作为分割点的视频场景对所述目标视频流进行分割。上述的方法,优选的,按所述目标视频流的播放顺序,依次对存在相邻关系的前后两帧视频图片进行场景识别包括:将存在相邻关系的前后两帧视频图片中的每一帧视频图片按预设的比例去除,得到第一图片和第二图片;分别将所述第一图片和所述第二图片均分为左右两部分,得到第一图片的左侧部分和右侧部分和第二图片的左侧部分和右侧部分;分别对所述第一图片和所述第二图片的左侧部分及所述第一图片和所述第二图片的右侧部分进行卡方计算,得到第一卡方距离和第二卡方距离,若所述第一卡方距离和所述第二卡方距离同时满足预设值,对所述存在相邻关系的前后两帧视频图片进行场景分割。上述的方法,优选的,对于任意一个存在人脸图像和/或人脸的五官特征的视频场景,获取该视频场景中包含的人脸图片集包括:获取所述视频场景中的各个人脸图片,按预设的高度区间对所述各个人脸图片进行分类,得到所述各个人脸图片的分类集;依据预设的裁剪系数设定方法,确定每一个分类对应的裁剪系数;依据所述裁剪系数,对所述每一个分类中的每一张人脸图片进行裁剪,得到所述视频场景中包含的人脸图片集。上述的方法,优选的,对于任意一个存在人脸图像和/或人脸的五官特征的视频场景,获取与所述人脸图片集对应的服装图片集包括:获取所述人脸图片集中每一张人脸图片的位置坐标;依据预设的优化公式,将所述位置坐标转化为与所述每一张人脸图片对应的服装图片的坐标,依据所述服装图片的坐标,确定所述每一张人脸图片对应的服装图片,获得与所述人脸图片集对应的服装图片集。上述的方法,优选的,分别对所述人脸图片集及所述服装图片集进行聚类分析,获得聚类分析结果,并在所述聚类分析结果对应的聚类值小于预设阈值时,按预设的判定规则,判定该视频场景为所述目标视频流的分割点包括:获取所述人脸图片集中任意两张人脸图片对应的像素矩阵,对所述像素矩阵进行聚类分析,获得所述人脸图片集的聚类值;将所述服装图片集中的任意两张服装图片的张量直方图进行聚类分析,获得所述服装图片集的聚类值;当所述人脸图片集的聚类值和所述服装图片集的聚类值均小于预设阈值时,按预设的判定规则,判定该视频场景为所述目标视频流的分割点。一种视频分割系统,其特征在于,包括:第一获取模块,用于当接收到用户对目标视频流的分割请求时,获取组成所述目标视频流的每一帧视频图像;转化模块,用于将所述每一帧视频图像转换为预定格式的视频图片;第一识别模块,用于按所述目标视频流的播放顺序,依次对存在相邻关系的前后两帧视频图片进行场景识别,识别出所述目标视频流中包含的至少两个视频场景;第二识别模块,用于按预设的识别规则,识别每一个视频场景中是否存在人脸图像和/或人脸的五官特征;第二获取模块,用于对于任意一个存在人脸图像和/或人脸的五官特征的视频场景,获取该视频场景中包含的人脸图片集及所述人脸图片集对应的服装图片集;判定模块,用于分别对所述人脸图片集及所述服装图片集进行聚类分析,获得聚类分析结果;并在所述聚类分析结果对应的聚类值小于预设阈值时,按预设的判定规则,判定该视频场景为所述目标视频流的分割点;分割模块,用于依据各个作为分割点的视频场景对所述目标视频流进行分割。上述的系统,优选的,所述第一识别模块包括:去除单元,用于将存在相邻关系的前后两帧视频图片中的每一帧视频图片按预设的比例去除,得到第一图片和第二图片;均分单元,用于分别将所述第一图片和所述第二图片均分为左右两部分,得到第一图片的左侧部分和右侧部分和第二图片的左侧部分和右侧部分;分割单元,用于分别对所述第一图片和所述第二图片的左侧部分及所述第一图片和所述第二图片的右侧部分进行卡方计算,得到第一卡方距离和第二卡方距离,若所述第一卡方距离和所述第二卡方距离同时满足预设值,对所述存在相邻关系的前后两帧视频图片进行场景分割。上述的系统,优选的,所述第二获取模块包括:分类单元,用于获取所述视频场景中的各个人脸图片,按预设的高度区间对所述各个人脸图片进行分类,得到所述各个人脸图片的分类集;确定单元,用于依据预设的裁剪系数设定方法,确定每一个分类对应的裁剪系数;裁剪单元,用于依据所述裁剪系数,对所述每一个分类中的每一张人脸图片进行裁剪,得到所述视频场景中包含的人脸图片集。上述的系统,优选的,所述第二获取模块包括:获取单元,用于获取所述人脸图片集中每一张人脸图片的位置坐标;转化单元,用于依据预设的优化公式,将所述位置坐标转化为与所述每一张人脸图片对应的服装图片的坐标,依据所述服装图片的坐标,确定所述每一张人脸图片对应的服装图片,获得与所述人脸图片集对应的服装图片集。上述的系统,优选的,其特征在于,所述判定模块包括:第一聚类单元,用于获取所述人脸图片集中任意两张人脸图片对应的像素矩阵,对所述像素矩阵进行聚类分析,获得所述人脸图片集的聚类值;第二聚类单元,用于将所述服装图片集中的任意两张服装图片的张量直方图进行聚类分析,获得所述服装图片集的聚类值;判定单元,用于当所述人脸图片集的聚类值和所述服装图片集的聚类值均小于预设阈值时,按预设的判定规则,判定该视频场景为所述目标视频流的分割点。与现有技术相比,本专利技术包括以下优点:本专利技术提供了一种视频分割方法,包括:当接收到用户对目标视频流的分割请求时,依次获取组成所述目标视频流的每一帧视频图像;将所述每一帧视频图像转换为预定格式的视频图片;按所述目标视频流的播放顺序,依次对存在相邻关系的前后两帧视频图片进行场景识别,识别出所述目标视频流中包本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/62/201710456998.html" title="一种视频分割方法及系统原文来自X技术">视频分割方法及系统</a>

【技术保护点】
一种视频分割方法,其特征在于,包括:当接收到用户对目标视频流的分割请求时,获取组成所述目标视频流的每一帧视频图像;将所述每一帧视频图像转换为预定格式的视频图片;按所述目标视频流的播放顺序,依次对存在相邻关系的前后两帧视频图片进行场景识别,识别出所述目标视频流中包含的至少两个视频场景;按预设的识别规则,识别每一个视频场景中是否存在人脸图像和/或人脸的五官特征;对于任意一个存在人脸图像和/或人脸的五官特征的视频场景,获取该视频场景中包含的人脸图片集及所述人脸图片集对应的服装图片集;分别对所述人脸图片集及所述服装图片集进行聚类分析,获得聚类分析结果;并在所述聚类分析结果对应的聚类值小于预设阈值时,按预设的判定规则,判定该视频场景为所述目标视频流的分割点;依据各个作为分割点的视频场景对所述目标视频流进行分割。

【技术特征摘要】
1.一种视频分割方法,其特征在于,包括:当接收到用户对目标视频流的分割请求时,获取组成所述目标视频流的每一帧视频图像;将所述每一帧视频图像转换为预定格式的视频图片;按所述目标视频流的播放顺序,依次对存在相邻关系的前后两帧视频图片进行场景识别,识别出所述目标视频流中包含的至少两个视频场景;按预设的识别规则,识别每一个视频场景中是否存在人脸图像和/或人脸的五官特征;对于任意一个存在人脸图像和/或人脸的五官特征的视频场景,获取该视频场景中包含的人脸图片集及所述人脸图片集对应的服装图片集;分别对所述人脸图片集及所述服装图片集进行聚类分析,获得聚类分析结果;并在所述聚类分析结果对应的聚类值小于预设阈值时,按预设的判定规则,判定该视频场景为所述目标视频流的分割点;依据各个作为分割点的视频场景对所述目标视频流进行分割。2.根据权利要求1所述的方法,其特征在于,按所述目标视频流的播放顺序,依次对存在相邻关系的前后两帧视频图片进行场景识别包括:将存在相邻关系的前后两帧视频图片中的每一帧视频图片按预设的比例去除,得到第一图片和第二图片;分别将所述第一图片和所述第二图片均分为左右两部分,得到第一图片的左侧部分和右侧部分和第二图片的左侧部分和右侧部分;分别对所述第一图片和所述第二图片的左侧部分及所述第一图片和所述第二图片的右侧部分进行卡方计算,得到第一卡方距离和第二卡方距离,若所述第一卡方距离和所述第二卡方距离同时满足预设值,对所述存在相邻关系的前后两帧视频图片进行场景分割。3.根据权利要求1所述的方法,其特征在于,对于任意一个存在人脸图像和/或人脸的五官特征的视频场景,获取该视频场景中包含的人脸图片集包括:获取所述视频场景中的各个人脸图片,按预设的高度区间对所述各个人脸图片进行分类,得到所述各个人脸图片的分类集;依据预设的裁剪系数设定方法,确定每一个分类对应的裁剪系数;依据所述裁剪系数,对所述每一个分类中的每一张人脸图片进行裁剪,得到所述视频场景中包含的人脸图片集。4.根据权利要求1所述的方法,其特征在于,对于任意一个存在人脸图像和/或人脸的五官特征的视频场景,获取与所述人脸图片集对应的服装图片集包括:获取所述人脸图片集中每一张人脸图片的位置坐标;依据预设的优化公式,将所述位置坐标转化为与所述每一张人脸图片对应的服装图片的坐标,依据所述服装图片的坐标,确定所述每一张人脸图片对应的服装图片,获得与所述人脸图片集对应的服装图片集。5.根据权利要求1所述的方法,其特征在于,分别对所述人脸图片集及所述服装图片集进行聚类分析,获得聚类分析结果,并在所述聚类分析结果对应的聚类值小于预设阈值时,按预设的判定规则,判定该视频场景为所述目标视频流的分割点包括:获取所述人脸图片集中任意两张人脸图片对应的像素矩阵,对所述像素矩阵进行聚类分析,获得所述人脸图片集的聚类值;将所述服装图片集中的任意两张服装图片的张量直方图进行聚类分析,获得所述服装图片集的聚类值;当所述人脸图片集的聚类值和所述服装图片集的聚类值均小于预设阈值时,按预设的判...

【专利技术属性】
技术研发人员:徐佳宏李益永兰志才曾勇韩涛
申请(专利权)人:深圳市茁壮网络股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1