一种基于对象识别机器学习模型的视频处理方法及系统技术方案

技术编号：46083485 阅读：6 留言：0更新日期：2025-08-12 18:05

本申请属于图像处理技术领域。一种基于对象识别机器学习模型的视频处理方法包括以时间维度，基于镜头场景，将原始视频进行分割，得到多个单场景短视频；利用对象识别机器学习模型，对每个单场景短视频的目标对象进行识别，确定目标对象在图像中的区域；将多个单场景短视频对应的目标对象在图像中的区域重叠合并，得到范围组；在范围组中，以范围最大的区域边缘为基准，进行视频裁剪，得到裁剪单场景短视频；将裁剪单场景短视频，依据预设的方向进行旋转，并缩放，再依据比例要求，对空白区域进行填充，得到目标单场景短视频；将多个目标单场景短视频，以时间维度进行拼接处理，得到目标视频。使得视频能够更高效地适应不同平台和设备的需求。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于图像处理，尤其涉及一种基于对象识别机器学习模型的视频处理方法及系统。

技术介绍

1、当前视频类应用已形成显著的设备使用分界：以抖音、快手为代表的短视频平台构建于移动优先的生态系统，其用户超过90％的访问量源自智能手机端，这种设备特性直接塑造了用户单手握持、快速切换的交互模式；而b站、youtube等长视频平台则保留了深厚的pc端用户基础，根据第三方数据显示，b站网页端用户日均观看时长仍占据总使用时长的35％以上，youtube桌面端用户贡献了平台近半数的深度内容消费。

2、这种设备使用差异直接驱动视频呈现形式的专业化发展。短视频平台通过技术迭代构建了竖屏交互体系：9:16的纵向画幅不仅适配手机屏幕的物理形态，更通过上下滑动的手势操作重构了内容消费节奏。平台算法会根据竖屏视频的完播率、互动频率进行流量加权，这使得品牌制作的竖版广告能获得更高的自然曝光。反观长视频平台，16:9的横向画幅设计延续了影院级视听标准，尤其在pc端场景中，用户常通过大屏显示器进行沉浸式观看，这种环境下的宽幅画面能更完整地呈现产品细节与场景氛围。

3、本文档来自技高网...

【技术保护点】

1.一种基于对象识别机器学习模型的视频处理方法，其特征在于，方法包括：

2.根据权利要求1所述的基于对象识别机器学习模型的视频处理方法，其特征在于，所述以时间维度，基于镜头场景，将原始视频进行分割，得到多个单场景短视频的步骤，包括：

3.根据权利要求2所述的基于对象识别机器学习模型的视频处理方法，其特征在于，所述利用对象识别机器学习模型，对每个单场景短视频的目标对象进行识别，确定所述目标对象在图像中的区域的步骤，包括：

4.根据权利要求1所述的基于对象识别机器学习模型的视频处理方法，其特征在于，所述将多个所述单场景短视频对应的所述目标对象在图像中的区域...

【技术特征摘要】

1.一种基于对象识别机器学习模型的视频处理方法，其特征在于，方法包括：

4.根据权利要求1所述的基于对象识别机器学习模型的视频处理方法，其特征在于，所述将多个所述单场景短视频对应的所述目标对象在图像中的区域重叠合并，得到范围组的步骤，包括：

5.根据权利要求1所述的基于对象识别机器学习模型的视频处理方法，其特征在于，所述在所述范围组中，以范围最大的区域边缘为基准，进行视频裁剪，得到裁剪单场景短视频的步骤，包括：

<...

【专利技术属性】
技术研发人员：范凌，张敏鑫，
申请(专利权)人：特赞上海信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人