一种视频处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:44699226 阅读:20 留言:0更新日期:2025-03-19 20:50
本申请公开一种视频处理方法、装置、计算机设备及存储介质,属于人工智能技术领域。本申请通过对待处理视频进行分帧处理,得到视频帧组;将若干个视频帧组、视频描述文本和视频候选框输入到预训练的显著性检测模型,得到显著视频帧组;获取显著视频帧组对应的候选框区域,并获取待处理视频对应的真实标注区域;基于候选框区域和真实标注区域,计算显著性检测模型的预测损失;基于预测损失对显著性检测模型进行迭代更新,得到更新后的显著性检测模型;获取待查询文本,将待查询文本输入到更新后的显著性检测模型中,得到视频查询结果。本申请还涉及区块链技术领域,待查询文本存储在区块链网络。本申请提升了模型对视频片段的定位精度。

【技术实现步骤摘要】

本申请属于人工智能,具体涉及一种视频处理方法、装置、计算机设备及存储介质


技术介绍

1、视频片段检索是指从大量的视频数据中找到所需的视频片段的过程。在视频分享网站、在线视频网站等平台上,用户可以通过输入关键词或描述来查找感兴趣的影视片段、综艺节目片段等,这有助于用户快速定位到想要观看的内容,提高用户体验。以在线保险理赔学习教程视频为例,用户可以通过输入关键词如“车险理赔流程”或描述特定场景,以精准查找到相关教学片段,从而节省时间,专注学习重点。

2、业内传统视频片段检索的方法一般是采用人工对视频进行打标签,逐个为视频片段标写文本内容,然后通过文本检索文本的形式,检索出对应的视频的片段,这种方式太过于依赖人工操作,效率较低,容易受到主观因素影响,并且使用人工方式进行视频标注,费时费力,成本较高。

3、随着人工智能技术的不断发展,视频片段检索变得更加智能化,目前一些基于机器学习技术的图片描述模型,通过对视频进行抽取关键帧,并对抽取的关键帧进行文本描述,再通过检索模型采用文本对文本的检索方式实现视频片段检索。但这种方式在处理帧与帧直接的本文档来自技高网...

【技术保护点】

1.一种视频处理方法,其特征在于,包括:

2.如权利要求1所述的视频处理方法,其特征在于,所述获取视频描述文本和视频候选框,并将若干个所述视频帧组、所述视频描述文本和所述视频候选框输入到预训练的显著性检测模型,得到显著视频帧组的步骤,具体包括:

3.如权利要求2所述的视频处理方法,其特征在于,所述将若干个所述视频帧组特征向量、所述文本分词特征向量和所述视频候选框特征向量输入所述预训练的显著性检测模型,得到所述显著视频帧组的步骤,具体包括:

4.如权利要求3所述的视频处理方法,其特征在于,所述针对每一个所述视频帧组特征向量,结合所述文本分词特征向量和所述...

【技术特征摘要】

1.一种视频处理方法,其特征在于,包括:

2.如权利要求1所述的视频处理方法,其特征在于,所述获取视频描述文本和视频候选框,并将若干个所述视频帧组、所述视频描述文本和所述视频候选框输入到预训练的显著性检测模型,得到显著视频帧组的步骤,具体包括:

3.如权利要求2所述的视频处理方法,其特征在于,所述将若干个所述视频帧组特征向量、所述文本分词特征向量和所述视频候选框特征向量输入所述预训练的显著性检测模型,得到所述显著视频帧组的步骤,具体包括:

4.如权利要求3所述的视频处理方法,其特征在于,所述针对每一个所述视频帧组特征向量,结合所述文本分词特征向量和所述视频候选框特征向量构建每一个所述视频帧组特征向量的显著性矩阵,得到若干个显著性矩阵的步骤,具体包括:

5.如权利要求1所述的视频处理方法,其特征在于,所述预测损失为交并比损失,所述基于所述候选框区域和所述真实标注区域,计算所述显著性检测模型的预...

【专利技术属性】
技术研发人员:舒畅陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1