基于多摄像机的视频展示方法、装置及存储介质制造方法及图纸

技术编号:38469062 阅读:8 留言:0更新日期:2023-08-11 14:46
本发明专利技术提供一种基于多摄像机的视频展示方法、装置及存储介质,向所述多个从机下发采集指令,并接收由所述从机返回的视频数据;计算本地时间戳与每个视频数据的视频时间戳之间的差值;保留所述本地时间戳与视频时间戳之间的差值小于或等于预设值的视频数据;根据保留的视频数据,生成待展示视频,并将展示所述待展示视频;可以提高视频的展示效果。可以提高视频的展示效果。可以提高视频的展示效果。

【技术实现步骤摘要】
基于多摄像机的视频展示方法、装置及存储介质


[0001]本专利技术涉及视频
,特别涉及一种基于多摄像机的视频展示方法、装置及存储介质。

技术介绍

[0002]随着科技的发展,人们可以使用各种终端设备进行线上会议,例如,语音会议、视频会议等等。线上会议的方式无需人们在约定的时间到达约定的地点才能开展会议,使会议开展更高效更便捷。
[0003]对于稍大一些的会议室,需要部署多台从机设备采集会议数据,然后,主机设备将从机设备采集的会议数据合成视频图像,并将该视频图像在展示方的屏幕中进行展示,然而,由于主机设备与从机设备之间存在时间差异,导致合成的视频图像可能会存在画面衔接不上的问题,降低了视频的展示效果。

技术实现思路

[0004]本专利技术提供一种基于多摄像机的视频展示方法、装置及存储介质,可以提高视频的展示效果。
[0005]第一方面,本专利技术提出一种基于多摄像机的视频展示方法,包括:
[0006]向所述多个从机下发采集指令,并接收由所述从机返回的视频数据;
[0007]计算本地时间戳与每个视频数据的视频时间戳之间的差值;
[0008]保留所述本地时间戳与视频时间戳之间的差值小于或等于预设值的视频数据;
[0009]根据保留的视频数据,生成待展示视频,并将展示所述待展示视频。
[0010]可选地,在本专利技术的一些实施例中,所述根据保留的视频数据,确定待展示视频,包括:
[0011]从保留的视频数据中提取场景图像和场景声音;
>[0012]对所述场景图像进行人脸检测;
[0013]基于检测结果在所述场景图像中裁剪出每个人脸对应的人像图像;
[0014]根据所述场景声音和人像图像,生成待展示视频。
[0015]可选地,在本专利技术的一些实施例中,所述基于检测结果在所述场景图像中裁剪出每个人脸对应的人像图像,包括:
[0016]基于检测结果在所述场景图像中构建覆盖人脸的人脸框;
[0017]根据所述人脸框的尺寸信息以及所述人脸框的坐标信息,在所述场景图像中分割出每个人脸对应的人像图像。
[0018]可选地,在本专利技术的一些实施例中,所述根据所述人脸框的尺寸信息以及所述人脸框的坐标信息,在所述场景图像中分割出每个人脸对应的人像图像,包括:
[0019]根据所述人脸框的坐标信息,确定所述人脸框中人脸在所述场景图像的位置;
[0020]基于所述人脸框的尺寸信息,确定所述人脸框中人脸的人脸尺寸;
[0021]根据所述位置以及人脸尺寸,在所述场景图像中分割出每个人脸对应的人像图像。
[0022]可选地,在本专利技术的一些实施例中,还包括:
[0023]检测分割的人像图像中是否存在相同的人脸;
[0024]当检测到分割的人像图像中存在相同的人脸,获取预设人脸五官的三维坐标;
[0025]根据所述人脸框的坐标信息确定所述人脸框中人脸对应的二维坐标;
[0026]基于所述二维坐标和三维坐标,识别具备相同人脸的人像图像中人脸的朝向;
[0027]根据所述人脸的朝向以及所述尺寸信息,在具备相同人脸的人像图像中确定目标人像图像。
[0028]可选地,在本专利技术的一些实施例中,所述基于所述二维坐标和三维坐标,识别具备相同人脸的人像图像中人脸的朝向,包括:
[0029]构建所述二维坐标与所述三维坐标之间的转换关系;
[0030]根据所述转换关系在所述人脸框中确定人脸对应的人脸区域;
[0031]对所述人脸区域进行归一化处理,并提取归一化图像的图像特征;
[0032]对所述图像特征进行卷积处理,得到所述图像特征对应的数值,并基于所述数值确定具备相同人脸的人像图像中人脸的朝向。
[0033]可选地,在本专利技术的一些实施例中,所述检测分割的人像图像中是否存在相同的人脸,包括:
[0034]对分割的人像图像的像素进行归一化处理,并提取归一化的人像图像中人脸的特征向量;
[0035]将所述特征向量为低维的特征向量;
[0036]确定转换后特征向量对应的数组;
[0037]根据所述待选人像图像对应的数组,确定分割的人像图像中是否存在相同的人脸。
[0038]可选地,在本专利技术的一些实施例中,还包括:
[0039]对所述场景图像进行行人检测;
[0040]根据行人检测结果在所述场景图像中构建覆盖行人的行人框;
[0041]所述根据所述人脸框的尺寸信息以及所述人脸框的坐标信息,在所述场景图像中分割出每个人脸对应的人像图像,包括:根据所述行人框的尺寸信息、所述行人框的坐标信息、所述人脸框的尺寸信息以及所述人脸框的坐标信息,在所述场景图像中分割出每个人脸对应的人像图像
[0042]第二方面,本专利技术还提出一种分布式麦克风的音频同步装置,包括:
[0043]接收模块,用于向所述多个从机下发采集指令,并接收由所述从机返回的视频数据;
[0044]计算模块,用于计算本地时间戳与每个视频数据的视频时间戳之间的差值;
[0045]保留模块,用于保留所述本地时间戳与视频时间戳之间的差值小于或等于预设值的视频数据;
[0046]生成模块,用于根据保留的视频数据,生成待展示视频;
[0047]展示模块,用于将展示所述待展示视频。
[0048]第三方面,本专利技术还提出一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被执行时,实现上述任意一项所述的基于多摄像机的视频展示方法。
[0049]本专利技术一种基于多摄像机的视频展示方法、装置及存储介质,在向所述多个从机下发采集指令,并接收由所述从机返回的视频数据后,计算本地时间戳与每个视频数据的视频时间戳之间的差值,接着,保留所述本地时间戳与视频时间戳之间的差值小于或等于预设值的视频数据,最后,根据保留的视频数据,生成待展示视频,并将展示所述待展示视频。在本专利技术提供的视频展示方案中,将本地时间戳与视频时间戳之间的差值大于预设值的视频数据进行过滤,使得保留的视频数据之间的时延在一个较小的范围内,避免合成的视频图像可能会存在画面衔接不上的问题,进而提高了视频的展示效果。
附图说明
[0050]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面对实施例中所需要使用的附图作简单的介绍,下面描述中的附图仅为本专利技术的部分实施例相应的附图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他实施例的附图。
[0051]图1为本专利技术实施例提供的提供基于多摄像机的视频展示方法的流程示意图;
[0052]图2为本专利技术实施例提供的基于多摄像机的视频展示方法中展示待展示视频的示意图;
[0053]图3为本专利技术实施例提供的基于多摄像机的视频展示方法中优化模型的结构示意图;
[0054]图4为本专利技术实施例提供的基于多摄像机的视频展示方法中提取人像图像的示本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多摄像机的视频展示方法,其特征在于,包括:向所述多个从机下发采集指令,并接收由所述从机返回的视频数据;计算本地时间戳与每个视频数据的视频时间戳之间的差值;保留所述本地时间戳与视频时间戳之间的差值小于或等于预设值的视频数据;根据保留的视频数据,生成待展示视频,并将展示所述待展示视频。2.根据权利要求1所述的方法,其特征在于,所述根据保留的视频数据,确定待展示视频,包括:从保留的视频数据中提取场景图像和场景声音;对所述场景图像进行人脸检测;基于检测结果在所述场景图像中裁剪出每个人脸对应的人像图像;根据所述场景声音和人像图像,生成待展示视频。3.根据权利要求2所述的方法,其特征在于,所述基于检测结果在所述场景图像中裁剪出每个人脸对应的人像图像,包括:基于检测结果在所述场景图像中构建覆盖人脸的人脸框;根据所述人脸框的尺寸信息以及所述人脸框的坐标信息,在所述场景图像中分割出每个人脸对应的人像图像。4.根据权利要求3所述的方法,其特征在于,所述根据所述人脸框的尺寸信息以及所述人脸框的坐标信息,在所述场景图像中分割出每个人脸对应的人像图像,包括:根据所述人脸框的坐标信息,确定所述人脸框中人脸在所述场景图像的位置;基于所述人脸框的尺寸信息,确定所述人脸框中人脸的人脸尺寸;根据所述位置以及人脸尺寸,在所述场景图像中分割出每个人脸对应的人像图像。5.根据权利要求4所述的方法,其特征在于,还包括:检测分割的人像图像中是否存在相同的人脸;当检测到分割的人像图像中存在相同的人脸,获取预设人脸五官的三维坐标;根据所述人脸框的坐标信息确定所述人脸框中人脸对应的二维坐标;基于所述二维坐标和三维坐标,识别具备相同人脸的人像图像中人脸的朝向;根据所述人脸的朝向以及所述尺寸信息,在具备相同人脸的人像图像中确定目标人像图像。6.根据权利要求5所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:高方奇杨海军马睿郭锦文
申请(专利权)人:深圳看到科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1