【技术实现步骤摘要】
回归视频画面中屏幕的方法、装置、可读介质及电子设备
本公开涉及AI领域,具体地,涉及一种回归视频画面中屏幕的方法、装置、可读介质及电子设备。
技术介绍
在现在技术中,没有能够直接用于检测视频画面中屏幕的具体位置的方法,仅仅只能够检测到视频画面中是否存在屏幕、或者仅仅只能通过最小外接矩阵来对目标屏幕来进行表示,即只能得知屏幕所在的大概位置,但无法知道屏幕的具体位置。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。第一方面,本公开提供一种回归视频画面中屏幕的方法,所述方法包括:针对视频的一帧图像,将所述图像输入预设网络回归模型,得到所述预设网络回归模型输出的图像的分类结果,其中,所述分类结果为含有屏幕或不含屏幕,所述预设网络回归模型的边框BBox回归用于,在分类结果为含有屏幕时,回归输出按固定顺序依次表征屏幕的四个角的 ...
【技术保护点】
1.一种回归视频画面中屏幕的方法,其特征在于,所述方法包括:/n针对视频的一帧图像,将所述图像输入预设网络回归模型,得到所述预设网络回归模型输出的图像的分类结果,其中,所述分类结果为含有屏幕或不含屏幕,所述预设网络回归模型的边框BBox回归用于,在分类结果为含有屏幕时,回归输出按固定顺序依次表征屏幕的四个角的坐标;/n响应于获取到用于表征屏幕的四个角的坐标,根据所述四个角的坐标,回归所述屏幕的边框。/n
【技术特征摘要】
1.一种回归视频画面中屏幕的方法,其特征在于,所述方法包括:
针对视频的一帧图像,将所述图像输入预设网络回归模型,得到所述预设网络回归模型输出的图像的分类结果,其中,所述分类结果为含有屏幕或不含屏幕,所述预设网络回归模型的边框BBox回归用于,在分类结果为含有屏幕时,回归输出按固定顺序依次表征屏幕的四个角的坐标;
响应于获取到用于表征屏幕的四个角的坐标,根据所述四个角的坐标,回归所述屏幕的边框。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述预设网络回归模型输出的所述屏幕的四个角的坐标,计算所述屏幕的面积占所述图像面积的比例。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述预设网络回归模型输出的所述屏幕的四个角的坐标,计算所述屏幕相对于拍摄所述视频的摄像头的角度偏差。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述预设网络回归模型是通过以下方式训练得到的:
针对图像集,根据用户输入的标注指令对该图像集内包含有屏幕的图像进行标注,所述标注指令为根据固定顺序依次表示的该屏幕的四个角的坐标;
根据所述图像集和损失函数训练,得到所述预设网络回归模型;
其中,所述损失函数中的定位损失函数为SmoothL1,SmoothL1的输入和输出为根据固定顺序依次表征屏幕的四个角的坐标。
5.根据权利要求4所述的方法,其特征在于,根...
【专利技术属性】
技术研发人员:李佩易,王长虎,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。