一种多模态组合视频检索方法及装置制造方法及图纸

技术编号:45723712 阅读:18 留言:0更新日期:2025-07-04 18:46
本申请实施例提供一种多模态组合视频检索方法及装置,包括:获取文字信息和视觉信息;从所述文字信息中提取文字特征;从所述视觉信息中提取视觉特征;根据所述文字特征,从所述视觉信息中提取视觉语义特征;从所述文字特征和视觉语义特征中提取所述文字特征和视觉语义特征之间的共同特征和差异特征;根据所述视觉特征和共同特征,查询预设的视频信息库,得到与所述视觉特征和共同特征匹配的多个视频检索结果;根据差异特征对多个视频检索结果进行筛选,得到筛选后的视频检索结果。本申请能够融合多模态信息的有效信息,准确理解用户的真实意图,提高多模态组合式视频检索的准确性。

【技术实现步骤摘要】

本申请实施例涉及信息检索,尤其涉及一种多模态组合视频检索方法及装置


技术介绍

1、随着视频检索和人工智能技术的发展,多模态组合视频检索技术也在不断演进,用户可利用文本、视频和/或图像等作为组合检索条件,检索匹配的视频,提供更加灵活个性的检索体验。然而,利用组合检索条件进行检索时,检索过程仍是将文本、图像、视频分别进行相似度对比,三个条件各自独立,没有考虑用户多模态需求之间的关联性,难以准确理解用户的真实意图,检索结果不够准确。


技术实现思路

1、有鉴于此,本申请实施例的目的在于提出一种多模态组合视频检索方法及装置,以解决检索结果不准确的问题。

2、基于上述目的,本申请实施例提供了一种多模态组合视频检索方法,包括:

3、获取文字信息和视觉信息;

4、从所述文字信息中提取文字特征;

5、从所述视觉信息中提取视觉特征;

6、根据所述文字特征,从所述视觉信息中提取视觉语义特征;

7、从所述文字特征和视觉语义特征中提取所述文字特征和视觉语义特征之本文档来自技高网...

【技术保护点】

1.一种多模态组合视频检索方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,从所述文字信息中提取文字特征,包括:

3.根据权利要求2所述的方法,其特征在于,从所述文字特征和视觉语义特征中提取所述文字特征和视觉语义特征之间的共同特征和差异特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述视频信息库包括多个视频文件及各视频文件对应的视频特征和语义特征;

5.根据权利要求4所述的方法,其特征在于,根据所述差异特征对多个视频检索结果进行筛选,得到筛选后的视频检索结果,包括:

6.根据权利要求4所述的方法,其特...

【技术特征摘要】

1.一种多模态组合视频检索方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,从所述文字信息中提取文字特征,包括:

3.根据权利要求2所述的方法,其特征在于,从所述文字特征和视觉语义特征中提取所述文字特征和视觉语义特征之间的共同特征和差异特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述视频信息库包括多个视频文件及各视频文件对应的视频特征和语义特征;

5.根据权利要求4所述的方法,其特征在于,根据所述差异特征对多个视频检索结果进行筛选,得到筛选后的视频检索结果,包括:

6.根据权利要求4所述的方法,其特征...

【专利技术属性】
技术研发人员:孙松林曾智张桂煊白倞安单楚越刘宇轩唐靓园孟楷童曹凌尚
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1