一种图像检索方法、装置、设备及存储介质制造方法及图纸

技术编号：42886015 阅读：26 留言：0更新日期：2024-09-30 15:07

本申请提供了一种图像检索方法、装置、设备及存储介质，涉及数据处理技术领域，该方法通过根据用户对预先训练好的多模态大模型的第一次检索结果的反馈，进一步优化预先训练好的多模态大模型，提高了图像检索的精准度。然后通过用户继续对优化后的模型生成的第二检索结果进行反馈，从而实现对多模态大模型的再次优化。这种基于用户反馈的模型优化策略，能够确保检索结果更加贴近用户的实际需求，提升用户体验，这种迭代优化的方式能够持续提高模型的性能，确保检索结果的质量随着用户的使用而不断提升。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，尤其涉及一种图像检索方法、装置、设备及存储介质。

技术介绍

1、随着互联网技术的快速发展，图像数据呈现爆炸性增长，如何有效地从海量的图像数据中检索出用户感兴趣的图像，成为了当前研究领域的热点之一。传统的图像检索方法主要依赖于图像的视觉特征，如颜色、纹理、形状等，进行相似度匹配，但这种方法在表达图像语义信息方面存在局限性，难以满足用户对于检索结果的个性化需求。

2、近年来，深度学习技术的兴起为图像检索领域带来了新的突破。通过构建深度神经网络模型，可以自动学习图像的复杂特征表示，从而更准确地捕捉图像的语义信息。其中，多模态大模型，如跨模态预训练模型(cross-modal pre-trained models)，能够通过联合学习不同模态(如文本和图像)的数据，实现跨模态的语义匹配，为图像检索提供了新的解决方案。

3、然而，尽管多模态大模型在图像检索方面取得了显著进展，但仍然存在一些挑战。首先，由于多模态大模型通常需要在大量数据上进行预训练，以获取足够的泛化能力，这导致在适配新的图像检索任务时，可能...

【技术保护点】

1.一种图像检索方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述响应于用户对第一检索结果的反馈结果之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述用户对所述第一检索结果进行反馈包括：

4.根据权利要求3所述的方法，其特征在于，所述用户对所述第一检索结果中的所述k个图像分别进行结果反馈包括：

5.根据权利要求1所述的方法，其特征在于，所述对预先训练好的多模态大模型进行第一次优化包括：

6.根据权利要求1所述的方法，其特征在于，所述若所述用户对所述第二检索结果进行反馈，则对所述完...

【技术特征摘要】

1.一种图像检索方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述响应于用户对第一检索结果的反馈结果之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述用户对所述第一检索结果进行反馈包括：

4.根据权利要求3所述的方法，其特征在于，所述用户对所述第一检索结果中的所述k个图像分别进行结果反馈包括：

5.根据权利要求1所述的方法，其特征在于，所述对预先训练好的多模态大模型进行第一次优化包括：

6.根据权利要求1所述的方法，其特征在于，所述若...

【专利技术属性】
技术研发人员：金越，
申请(专利权)人：太保科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人