全景视频导出方法、装置、终端设备以及存储介质制造方法及图纸

技术编号：39050053 阅读：11 留言：0更新日期：2023-10-12 19:42

本发明专利技术实施例提出了一种全景视频导出方法、装置、终端设备以及存储介质，涉及视频处理技术领域；能够自动评价全景视频中视角物体的精彩程度，选择精彩的视角物体进行跟踪导出2D视频。所述方法包括：获得全景视频的关键帧；基于预设视觉目标检测模型，在所述关键帧显示的所有视觉目标中选取精彩程度高于预设阈值的至少一个跟踪视觉目标；追踪根据所述至少一个跟踪视觉目标生成的追踪框，生成运动轨迹序列；其中，所述运动轨迹序列表示所述至少一个跟踪视觉目标在所述全景视频中的位置变化；对所述运动轨迹序列进行全景投影，获得所述跟踪视觉目标的运动视频。视觉目标的运动视频。视觉目标的运动视频。

全部详细技术资料下载

【技术实现步骤摘要】
全景视频导出方法、装置、终端设备以及存储介质

[0001]本专利技术实施例涉及视频处理
，尤其涉及一种全景视频导出方法、装置、终端设备以及存储介质。

技术介绍

[0002]为解决常规摄像装置的局限性：录制视频的视角极其狭小，无法记录许多重要的细节，全景视频记录了相机所在360度球面的所有视觉信息，用户在拍摄时无需运镜取景，只需在拍摄完后手动选定特定视角的视频内容进行导出，可以获得任意视觉目标的视频。但目前往往需要人工查看全景视频的所有画面，选择精彩的画面进行内容导出，并且导出过程需要用户在每个时间戳上选定视角目标进行导出，操作繁琐且低效。

技术实现思路

[0003]本专利技术实施例提供了一种全景视频导出方法、装置、终端设备以及存储介质，能够自动评价全景视频中视角物体的精彩程度，选择精彩的视角物体进行跟踪导出2D视频。
[0004]第一方面，本专利技术实施例提供一种全景视频导出方法，应用于电子终端设备，所述方法包括：
[0005]获得全景视频的关键帧；所述关键帧为所述全景视频中的任意图像帧；基于本专利技术第一方面构建的视觉目标检测模型对所述关键帧提取第一高维度特征图；基于所述视觉目标检测模型根据所述第一高维度特征图，对所述关键帧显示的所有视觉目标进行精彩程度评估；根据精彩程度评估结果选择至少一个视觉目标作为跟踪视觉目标追踪根据所述至少一个跟踪视觉目标生成的追踪框，生成运动轨迹序列；其中，所述运动轨迹序列表示所述至少一个跟踪视觉目标在所述全景视频中的位置变化；对所述运动轨...

【技术保护点】

【技术特征摘要】
1.一种视觉目标检测模型构建方法，其特征在于，所述方法包括：构建包含多个全景图像的样本集；根据多个维度对精彩程度的评价标准，对所述样本集中的各全景图像中具有精彩特性的物体标注综合得分；所述多个维度包括：目标类别、运动状态、人物属性、显著性；利用携带标注的全景图像训练预先构建的多层神经网络，直至所述多层神经网络针对物体输出的跟踪视觉目标与所述目标物体一致，并且精彩程度评分与对应标注综合得分相差程度小于预设阈值，将经过多次训练多层神经网络作为所述视觉目标检测模型。2.根据权利要求1所述的方法，其特征在于，所述预先构建的多层神经网络包括：第一多层卷积神经网络、第二多层卷积神经网络以及评分子网络；其中，第二多层卷积神经网络和评分子网络分别连接所述第一多层卷积神经网络。3.一种全景视频导出方法，其特征在于，所述方法包括：获得全景视频的关键帧；所述关键帧为所述全景视频中的任意图像帧；基于如权利要求1或2构建的视觉目标检测模型对所述关键帧提取第一高维度特征图；基于所述视觉目标检测模型根据所述第一高维度特征图，对所述关键帧显示的所有视觉目标进行精彩程度评估；根据精彩程度评估结果选择至少一个视觉目标作为跟踪视觉目标；追踪根据所述至少一个跟踪视觉目标生成的追踪框，生成运动轨迹序列；其中，所述运动轨迹序列表示所述至少一个跟踪视觉目标在所述全景视频中的位置变化；对所述运动轨迹序列进行平面投影，获得所述跟踪视觉目标的运动视频。4.根据权利要求3所述的方法，其特征在于，所述方法还包括：基于视觉目标检测模型，输出所述至少一个跟踪视觉目标的位置坐标；追踪根据所述至少一个跟踪视觉目标生成的追踪框，生成运动轨迹序列，包括：根据所述位置坐标，追踪根据所述至少一个跟踪视觉目标生成的追踪框，生成运动轨迹序列。5.根据权利要求3所述的方法，其特征在于，所述方法还包括：响应用户指定的剪辑指令，获得待显示物体和视频时间长度；获得与待显示物体匹配的多个跟踪视觉目标；按照所述多个跟踪视觉目标的运动视频各自对应的精彩程度评分大小，顺序选取对应目标运动视频作为待剪辑视频；从所述待剪辑视频截取符合所述视频时间长度的片段，获得用户指定的显示物体的运动视频。6.根据权利要求3所述的方法，其特征在于，所述视觉目标检测模型包括第一多层卷积神经网络、第二多层卷积神经网络以及评分子网络；基于视觉目标检测模型对所述关键帧提取高维度特征图，包括：将所述关键帧输入所述视觉目标检测模型的第一多层卷积神经网络，输出所述高维度特征图；对所述高维度特征图进行ROIAlign操作，得到池化后的高维度特征图；基于所述视觉目标检测模型根据所述高维度特征图，对所述关键帧显示的所有视觉目标进行精彩程度评分，包括：
将所述池化后的高维度特征图输入所述评分子网络，输出所述关键帧中所有视觉目标的精彩程度评分。7.根据权利要求3所述的方法，其特征在于，在所述全景视频的目标帧图像追踪到所述跟踪视觉目标后，所述方法还包括：基于视觉目标检测模型对所述目标帧图像提取第二高维度特征图；基于所述视觉目标检测模型根据所述第二高维度特征图，对所述目标帧图像显示的所有视觉目标进行精彩程度评分；当所述目标帧图像中任意视觉目标的精彩程度评分大于所述跟踪视觉目标的精彩程度评分，在所述全景视频的每帧图像追踪该任意视觉目标。8.根据权利要求3所述的方法，其特征在于，根据精彩程度评估结果选择至少一个视觉目标作为跟踪视觉目标，包括将所述关键帧的所有视觉目标中精彩程度评分最高的视觉目标确定为跟踪视觉目标。9.根据权利要求3所述的方法，其特征在于，根据精彩程度评估结果选择至少一个视觉目标...

【专利技术属性】
技术研发人员：龙良曲，郭士嘉，姜文杰，
申请(专利权)人：影石创新科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人