基于大语言模型的音频和视频检索方法、系统及存储介质技术方案

技术编号：44132327 阅读：28 留言：0更新日期：2025-01-24 22:52

本发明专利技术提供了一种基于大语言模型的音频和视频检索方法、系统及存储介质，涉及计算机信息技术领域，方法包括以下步骤：获取与音频和视频检索内容相关的自然语言请求信息；根据大语言模型工具对请求信息进行向量化处理，提取出请求信息的检索信息；采用向量空间搜索算法在向量数据库中进行检索，筛选出其中与检索信息相匹配的向量；通过匹配向量的索引信息，在关系型数据库中进行检索，获取向量对应的关联信息，关联信息包括视频名称、文字内容和起止时间；将向量对应的目标视频或目标音频及其关联信息发送至客户端，并能够从起止时间内选择指定时间点播放目标视频或目标音频。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机信息，具体而言，涉及视频和音频检索方法。

技术介绍

1、视频检索是指在众多的视频文件中搜索出满足特定条件的片段，是一项难度较高的工作。然而，目前视频检索的应用场景极为广泛，对于如今尚未完全成熟的检索技术，要实现精准的视频内容识别，往往需要依赖复杂的多模态模型、先进的算法以及庞大的计算资源，数据处理过程复杂，处理时间较长，搜索效率较低，且服务器要求高。

技术实现思路

1、本专利技术的目的在于提供基于大语言模型的音频和视频检索方法、系统及存储介质，以解决目前视频检索速度较慢和成本较高的问题。

2、为解决上述问题，本专利技术首先提供了一种基于大语言模型的音频和视频检索方法，包括以下步骤：获取与音频和视频检索内容相关的自然语言请求信息；根据大语言模型工具对所述请求信息进行向量化处理，提取出所述请求信息的检索信息；采用向量空间搜索算法在向量数据库中进行检索，筛选出其中与所述检索信息相匹配的向量；通过匹配所述向量的索引信息，在关系型数据库中进行检索，获取所述向量对应的关...

【技术保护点】

1.一种基于大语言模型的音频和视频检索方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于大语言模型的音频和视频检索方法，其特征在于，所述向量数据库和所述关系型数据库的构建过程包括：

3.根据权利要求2所述的基于大语言模型的音频和视频检索方法，其特征在于，所述二次合并包括：

4.根据权利要求3所述的基于大语言模型的音频和视频检索方法，其特征在于，所述二次合并还包括：

5.根据权利要求1-4任一所述的基于大语言模型的音频和视频检索方法，其特征在于，将所述向量对应的目标视频或目标音频发送至客户端包括：

6.一种基于大语言模...

【技术特征摘要】

1.一种基于大语言模型的音频和视频检索方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于大语言模型的音频和视频检索方法，其特征在于，所述向量数据库和所述关系型数据库的构建过程包括：

3.根据权利要求2所述的基于大语言模型的音频和视频检索方法，其特征在于，所述二次合并包括：

4.根据权利要求3所述的基于大语言模型的音频和视频检索方法，其特征在于，所述二次合并还包括：

5.根据权利要求1-4任一所述的基于大语言模型的音频和视频检索方法，其特征在于，将所述向量对应的目标视频或目标音频发送至客户端包括：

6.一种基于大语言模型的音频和视频检索系统，...

【专利技术属性】
技术研发人员：周震，陶建宇，
申请(专利权)人：北京九恒星科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人