回归视频画面中屏幕的方法、装置、可读介质及电子设备制造方法及图纸

技术编号:23315784 阅读:25 留言:0更新日期:2020-02-11 18:02
本公开涉及AI领域,具体地,涉及一种回归视频画面中屏幕的方法、装置、可读介质及电子设备。本公开采用预设网络回归模型回归出视频画面中屏幕边框四个角的坐标,从而确定视频画面中出现的屏幕的具体位置。其中,预设网络回归模型的BBox回归是用于回归输出按固定顺序依次表征屏幕的四个角的坐标,即该预设网络回归模型对于目标物体的表达方式为表征屏幕的四个角构成的四角框,使得该预设网络回归模型在检测到该视频画面中含有屏幕时,能回归出视频画面中屏幕边框四个角的坐标,并结合屏幕为矩形的特点回归所述屏幕的边框,从而确定视频画面中出现的屏幕的具体位置。

Methods, devices, readable media and electronic devices for returning to the screen in the video picture

【技术实现步骤摘要】
回归视频画面中屏幕的方法、装置、可读介质及电子设备
本公开涉及AI领域,具体地,涉及一种回归视频画面中屏幕的方法、装置、可读介质及电子设备。
技术介绍
在现在技术中,没有能够直接用于检测视频画面中屏幕的具体位置的方法,仅仅只能够检测到视频画面中是否存在屏幕、或者仅仅只能通过最小外接矩阵来对目标屏幕来进行表示,即只能得知屏幕所在的大概位置,但无法知道屏幕的具体位置。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。第一方面,本公开提供一种回归视频画面中屏幕的方法,所述方法包括:针对视频的一帧图像,将所述图像输入预设网络回归模型,得到所述预设网络回归模型输出的图像的分类结果,其中,所述分类结果为含有屏幕或不含屏幕,所述预设网络回归模型的边框BBox回归用于,在分类结果为含有屏幕时,回归输出按固定顺序依次表征屏幕的四个角的坐标;响应于本文档来自技高网...

【技术保护点】
1.一种回归视频画面中屏幕的方法,其特征在于,所述方法包括:/n针对视频的一帧图像,将所述图像输入预设网络回归模型,得到所述预设网络回归模型输出的图像的分类结果,其中,所述分类结果为含有屏幕或不含屏幕,所述预设网络回归模型的边框BBox回归用于,在分类结果为含有屏幕时,回归输出按固定顺序依次表征屏幕的四个角的坐标;/n响应于获取到用于表征屏幕的四个角的坐标,根据所述四个角的坐标,回归所述屏幕的边框。/n

【技术特征摘要】
1.一种回归视频画面中屏幕的方法,其特征在于,所述方法包括:
针对视频的一帧图像,将所述图像输入预设网络回归模型,得到所述预设网络回归模型输出的图像的分类结果,其中,所述分类结果为含有屏幕或不含屏幕,所述预设网络回归模型的边框BBox回归用于,在分类结果为含有屏幕时,回归输出按固定顺序依次表征屏幕的四个角的坐标;
响应于获取到用于表征屏幕的四个角的坐标,根据所述四个角的坐标,回归所述屏幕的边框。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述预设网络回归模型输出的所述屏幕的四个角的坐标,计算所述屏幕的面积占所述图像面积的比例。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述预设网络回归模型输出的所述屏幕的四个角的坐标,计算所述屏幕相对于拍摄所述视频的摄像头的角度偏差。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述预设网络回归模型是通过以下方式训练得到的:
针对图像集,根据用户输入的标注指令对该图像集内包含有屏幕的图像进行标注,所述标注指令为根据固定顺序依次表示的该屏幕的四个角的坐标;
根据所述图像集和损失函数训练,得到所述预设网络回归模型;
其中,所述损失函数中的定位损失函数为SmoothL1,SmoothL1的输入和输出为根据固定顺序依次表征屏幕的四个角的坐标。


5.根据权利要求4所述的方法,其特征在于,根...

【专利技术属性】
技术研发人员:李佩易王长虎
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1