视频检索方法、装置、系统、电子设备及存储介质制造方法及图纸

技术编号：40657815 阅读：3 留言：0更新日期：2024-03-18 18:49

本发明专利技术提供一种视频检索方法、装置、系统、电子设备及存储介质，该方法包括：获取用户输入的视频检索信息；基于视频检索信息对视频标签信息库进行数据检索，确定与视频检索信息相匹配的目标标签信息，并确定目标标签信息对应的目标视频文件；视频标签信息库是基于对输入的多个视频文件的身份信息和每个视频文件的标签信息进行关联存储得到的；标签信息是通过将视频文件输入至预设的混合专家模型进行对象识别所确定的；混合专家模型包括多个用于执行不同视觉识别任务的专家模型。本发明专利技术可以在提升视频检索结果准确率的同时，也极大地减少了由人工查看视频带来的庞大工作量，大大提高了视频检索的效率，降低了开发成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频信息处理，尤其涉及一种视频检索方法、装置、系统、电子设备及存储介质。

技术介绍

1、在高精度地图构建、目标识别、目标追踪、限界检测等与雷达、摄像头相关的感知功能开发过程中，会有大量人力和工作投入到视频数据集的构建和标注中。在此过程中，数据工程师或算法工程师需要根据不同的场景、环境条件、车辆条件和时间范围收集有效视频数据，反复进行数据的切分以及数据集之间的组合。

2、为了避免工程师对逐个视频文件进行人工查找及审查，需要有一种自动化的方式来提升此类工作的效率。对此，现有技术中出现了许多基于预训练模型实现自动检索视频文件的方案。然而，此类方案中设计预训练模型的过程非常复杂，现行多数预训练模型的参数量在亿级以上，训练过程需要庞大的云平台和显卡资源作为支撑，成本较高，同时，视频数据的检索效率也不高。

技术实现思路

1、本专利技术提供一种视频检索方法、装置、系统、电子设备及存储介质，用以解决现有技术中基于预训练模型的视频检索方案过程复杂，成本较高，同时，视频数据的检索效率也不高的缺陷。

2、本专利技术提供一种视频检索方法，包括：

3、获取用户输入的视频检索信息；

4、基于所述视频检索信息对视频标签信息库进行数据检索，确定与所述视频检索信息相匹配的目标标签信息，并确定所述目标标签信息对应的目标视频文件；

5、所述视频标签信息库是基于对输入的多个视频文件的身份信息和每个所述视频文件的标签信息进行关联存储得到的；所述标签信

6、根据本专利技术提供的一种视频检索方法，所述混合专家模型包括权重路由模型、多个特征提取器和多个专家模型；每个所述特征提取器对应处理一类视频文件；在所述基于所述视频检索信息对视频标签信息库进行数据检索之前，所述方法还包括：

7、对于任一所述视频文件，将所述视频文件输入至对应的特征提取器进行视频特征提取，得到所述视频文件对应的视频特征向量；

8、将所述视频特征向量输入至所述权重路由模型，确定每个所述专家模型的权重信息，以根据每个所述专家模型的权重信息，确定用于识别所述视频特征向量的多个目标专家模型；

9、将所述视频特征向量分别输入至每个所述目标专家模型进行对象识别，得到每个所述目标专家模型输出的所述视频文件对应的标签子信息；

10、将每个所述目标专家模型输出的标签子信息发送给所述视频标签信息库，以供所述视频标签信息库对每个所述标签子信息进行分类组合，得到所述视频文件的标签信息，并将所述视频文件的身份信息和所述视频文件的标签信息进行关联存储。

11、根据本专利技术提供的一种视频检索方法，在所述将所述视频特征向量输入至所述权重路由模型之前，所述方法还包括：

12、获取多个视频文件样本的视频特征向量及每个所述视频文件样本对应的专家模型权重信息标签；

13、将每个所述视频文件样本的视频特征向量及对应的专家模型权重信息标签作为一组训练样本，获取多组所述训练样本；

14、利用多组所述训练样本，对所述权重路由模型进行训练。

15、根据本专利技术提供的一种视频检索方法，所述利用多组所述训练样本，对所述权重路由模型进行训练，包括：

16、对于任意一组训练样本，将所述训练样本输入至权重路由模型，输出所述训练样本对应的预测概率；

17、利用预设损失函数，根据所述训练样本对应的预测概率和所述训练样本中的专家模型权重信息标签计算损失值；

18、基于所述损失值，对所述权重路由模型的模型参数进行调整，直至模型训练次数达到预设次数；

19、将模型训练次数达到所述预设次数时所得到的模型参数作为训练好的权重路由模型的模型参数。

20、根据本专利技术提供的一种视频检索方法，所述预设损失函数是基于下述公式确定的：

21、

22、其中，lmi表示损失值；p(di)表示选取任务i的概率；p(di,ej)是专家模型j在任务i上被选到的概率；p(ej)是专家模型j在所有任务上被选到的期望；m表示任务数量，其基于所述视频文件样本的视频特征向量确定的；k表示专家模型数量。

23、根据本专利技术提供的一种视频检索方法，所述视频检索信息包括多个关键词；基于所述视频检索信息对视频标签信息库进行数据检索，确定与所述视频检索信息相匹配的目标标签信息，并确定所述目标标签信息对应的目标视频文件，包括：

24、将每个所述关键词分别与所述视频标签信息库中的各个标签信息进行文本匹配；

25、在确定所述各个标签信息中存在目标标签信息与至少两个所述关键词匹配成功的情况下，获取所述目标标签信息，并确定所述目标标签信息对应的视频文件的身份信息；

26、基于所述目标标签信息对应的视频文件的身份信息，获取所述身份信息对应的目标视频文件。

27、本专利技术还提供一种视频检索装置，包括：

28、获取模块，用于获取用户输入的视频检索信息；

29、检索模块，用于基于所述视频检索信息对视频标签信息库进行数据检索，确定与所述视频检索信息相匹配的目标标签信息，并确定所述目标标签信息对应的目标视频文件；

30、所述视频标签信息库是基于对输入的多个视频文件的身份信息和每个所述视频文件的标签信息进行关联存储得到的；所述标签信息是通过将所述视频文件输入至预设的混合专家模型进行对象识别所确定的；所述混合专家模型包括多个用于执行不同视觉识别任务的专家模型。

31、本专利技术还提供一种视频检索系统，包括：

32、识别模块、标签模块和检索模块；所述识别模块包括上述任一种所述的视频检索方法中的混合专家模型；所述标签模块包括上述任一种所述的视频检索方法中的视频标签信息库；

33、所述识别模块用于对输入的每个视频文件进行对象识别，输出每个所述视频文件的标签子信息；

34、所述标签模块用于对所述识别模块输出的每个所述视频文件的标签子信息进行分类组合，确定每个所述视频文件的标签信息，并对每个所述视频文件的标签信息和身份信息进行关联存储；

35、所述检索模块用于获取用户输入的视频检索信息，基于所述视频检索信息对所述标签模块存储的视频标签信息库进行数据检索，确定与所述视频检索信息相匹配的目标标签信息，并输出所述目标标签信息对应的目标视频文件。

36、本专利技术还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述视频检索方法。

37、本专利技术还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述视频检索方法。

38、本专利技术还提供一种计算机程序产品，包括计算机程序，所本文档来自技高网...

【技术保护点】

1.一种视频检索方法，其特征在于，包括：

2.根据权利要求1所述的视频检索方法，其特征在于，所述混合专家模型包括权重路由模型、多个特征提取器和多个专家模型；每个所述特征提取器对应处理一类视频文件；在所述基于所述视频检索信息对视频标签信息库进行数据检索之前，所述方法还包括：

3.根据权利要求2所述的视频检索方法，其特征在于，在所述将所述视频特征向量输入至所述权重路由模型之前，所述方法还包括：

4.根据权利要求3所述的视频检索方法，其特征在于，所述利用多组所述训练样本，对所述权重路由模型进行训练，包括：

5.根据权利要求4所述的视频检索方法，其特征在于，所述预设损失函数是基于下述公式确定的：

6.根据权利要求1-5任一项所述的视频检索方法，其特征在于，所述视频检索信息包括多个关键词；基于所述视频检索信息对视频标签信息库进行数据检索，确定与所述视频检索信息相匹配的目标标签信息，并确定所述目标标签信息对应的目标视频文件，包括：

7.一种视频检索装置，其特征在于，包括：

8.一种视频检索系统，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述视频检索方法。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述视频检索方法。

...

【技术特征摘要】

1.一种视频检索方法，其特征在于，包括：

3.根据权利要求2所述的视频检索方法，其特征在于，在所述将所述视频特征向量输入至所述权重路由模型之前，所述方法还包括：

4.根据权利要求3所述的视频检索方法，其特征在于，所述利用多组所述训练样本，对所述权重路由模型进行训练，包括：

5.根据权利要求4所述的视频检索方法，其特征在于，所述预设损失函数是基于下述公式确定的：

6.根据权利要...

【专利技术属性】
技术研发人员：付哲，张永增，袁彬彬，
申请(专利权)人：交控科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人