【技术实现步骤摘要】
本申请实施例涉及信息检索,尤其涉及一种多模态组合视频检索方法及装置。
技术介绍
1、随着视频检索和人工智能技术的发展,多模态组合视频检索技术也在不断演进,用户可利用文本、视频和/或图像等作为组合检索条件,检索匹配的视频,提供更加灵活个性的检索体验。然而,利用组合检索条件进行检索时,检索过程仍是将文本、图像、视频分别进行相似度对比,三个条件各自独立,没有考虑用户多模态需求之间的关联性,难以准确理解用户的真实意图,检索结果不够准确。
技术实现思路
1、有鉴于此,本申请实施例的目的在于提出一种多模态组合视频检索方法及装置,以解决检索结果不准确的问题。
2、基于上述目的,本申请实施例提供了一种多模态组合视频检索方法,包括:
3、获取文字信息和视觉信息;
4、从所述文字信息中提取文字特征;
5、从所述视觉信息中提取视觉特征;
6、根据所述文字特征,从所述视觉信息中提取视觉语义特征;
7、从所述文字特征和视觉语义特征中提取所述文字
...【技术保护点】
1.一种多模态组合视频检索方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,从所述文字信息中提取文字特征,包括:
3.根据权利要求2所述的方法,其特征在于,从所述文字特征和视觉语义特征中提取所述文字特征和视觉语义特征之间的共同特征和差异特征,包括:
4.根据权利要求1所述的方法,其特征在于,所述视频信息库包括多个视频文件及各视频文件对应的视频特征和语义特征;
5.根据权利要求4所述的方法,其特征在于,根据所述差异特征对多个视频检索结果进行筛选,得到筛选后的视频检索结果,包括:
6.根据权利要
...【技术特征摘要】
1.一种多模态组合视频检索方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,从所述文字信息中提取文字特征,包括:
3.根据权利要求2所述的方法,其特征在于,从所述文字特征和视觉语义特征中提取所述文字特征和视觉语义特征之间的共同特征和差异特征,包括:
4.根据权利要求1所述的方法,其特征在于,所述视频信息库包括多个视频文件及各视频文件对应的视频特征和语义特征;
5.根据权利要求4所述的方法,其特征在于,根据所述差异特征对多个视频检索结果进行筛选,得到筛选后的视频检索结果,包括:
6.根据权利要求4所述的方法,其特征...
【专利技术属性】
技术研发人员:孙松林,曾智,张桂煊,白倞安,单楚越,刘宇轩,唐靓园,孟楷童,曹凌尚,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。