基于大语言模型的音频和视频检索方法、系统及存储介质技术方案

技术编号:44132327 阅读:28 留言:0更新日期:2025-01-24 22:52
本发明专利技术提供了一种基于大语言模型的音频和视频检索方法、系统及存储介质,涉及计算机信息技术领域,方法包括以下步骤:获取与音频和视频检索内容相关的自然语言请求信息;根据大语言模型工具对请求信息进行向量化处理,提取出请求信息的检索信息;采用向量空间搜索算法在向量数据库中进行检索,筛选出其中与检索信息相匹配的向量;通过匹配向量的索引信息,在关系型数据库中进行检索,获取向量对应的关联信息,关联信息包括视频名称、文字内容和起止时间;将向量对应的目标视频或目标音频及其关联信息发送至客户端,并能够从起止时间内选择指定时间点播放目标视频或目标音频。

【技术实现步骤摘要】

本专利技术涉及计算机信息,具体而言,涉及视频和音频检索方法。


技术介绍

1、视频检索是指在众多的视频文件中搜索出满足特定条件的片段,是一项难度较高的工作。然而,目前视频检索的应用场景极为广泛,对于如今尚未完全成熟的检索技术,要实现精准的视频内容识别,往往需要依赖复杂的多模态模型、先进的算法以及庞大的计算资源,数据处理过程复杂,处理时间较长,搜索效率较低,且服务器要求高。


技术实现思路

1、本专利技术的目的在于提供基于大语言模型的音频和视频检索方法、系统及存储介质,以解决目前视频检索速度较慢和成本较高的问题。

2、为解决上述问题,本专利技术首先提供了一种基于大语言模型的音频和视频检索方法,包括以下步骤:获取与音频和视频检索内容相关的自然语言请求信息;根据大语言模型工具对所述请求信息进行向量化处理,提取出所述请求信息的检索信息;采用向量空间搜索算法在向量数据库中进行检索,筛选出其中与所述检索信息相匹配的向量;通过匹配所述向量的索引信息,在关系型数据库中进行检索,获取所述向量对应的关联信息,所述关联信息本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的音频和视频检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大语言模型的音频和视频检索方法,其特征在于,所述向量数据库和所述关系型数据库的构建过程包括:

3.根据权利要求2所述的基于大语言模型的音频和视频检索方法,其特征在于,所述二次合并包括:

4.根据权利要求3所述的基于大语言模型的音频和视频检索方法,其特征在于,所述二次合并还包括:

5.根据权利要求1-4任一所述的基于大语言模型的音频和视频检索方法,其特征在于,将所述向量对应的目标视频或目标音频发送至客户端包括:

6.一种基于大语言模...

【技术特征摘要】

1.一种基于大语言模型的音频和视频检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大语言模型的音频和视频检索方法,其特征在于,所述向量数据库和所述关系型数据库的构建过程包括:

3.根据权利要求2所述的基于大语言模型的音频和视频检索方法,其特征在于,所述二次合并包括:

4.根据权利要求3所述的基于大语言模型的音频和视频检索方法,其特征在于,所述二次合并还包括:

5.根据权利要求1-4任一所述的基于大语言模型的音频和视频检索方法,其特征在于,将所述向量对应的目标视频或目标音频发送至客户端包括:

6.一种基于大语言模型的音频和视频检索系统,...

【专利技术属性】
技术研发人员:周震陶建宇
申请(专利权)人:北京九恒星科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1