【技术实现步骤摘要】
本公开涉及人工智能,尤其涉及计算机视觉、深度学习、大模型等,可应用于图像处理等场景。具体涉及图像分类方法、深度学习模型的训练方法、装置、电子设备、存储介质以及程序产品。
技术介绍
1、随着图像数据量爆炸式增长,海量的数据源以及丰富的数据层次,使得依靠人工来分析和处理这些图像变得越来越困难。计算机视觉技术为解放人力提供巨大潜力。计算机视觉是一门研究如何使用电子设备“看”的科学,即,利用摄影机和电脑代替人眼对图像中的目标对象进行分类、搜索等的科学技术。实现人与机器之间的视觉问答、视觉对话等的智能交互。
技术实现思路
1、本公开提供了一种图像分类方法、深度学习模型的训练方法、装置、电子设备、存储介质以及程序产品。
2、根据本公开的一方面,提供了一种图像分类方法,包括:对待处理图像进行特征提取,得到图像特征;对上述图像特征进行聚类,得到图像聚类标记特征;基于上述图像聚类标记特征和任务提示标记特征,得到文本提示特征,其中,上述任务提示标记特征用于表征与图像分类任务相关的知识;以及基于上述
...【技术保护点】
1.一种图像分类方法,包括:
2.根据权利要求1所述的方法,其中,所述对所述图像特征进行聚类,得到图像聚类标记特征,包括:
3.根据权利要求2所述的方法,其中,所述对所述多个子图像特征进行聚类,得到多个聚类簇,包括:
4.根据权利要求2或3所述的方法,其中,所述基于所述多个聚类簇,得到所述图像聚类标记特征,包括:
5.根据权利要求1至4中任一项所述的方法,其中,所述基于所述文本提示特征和所述待处理图像,得到所述待处理图像的图像分类结果,包括:
6.根据权利要求5所述的方法,其中,所述基于所述文本提示特征和所述
...【技术特征摘要】
1.一种图像分类方法,包括:
2.根据权利要求1所述的方法,其中,所述对所述图像特征进行聚类,得到图像聚类标记特征,包括:
3.根据权利要求2所述的方法,其中,所述对所述多个子图像特征进行聚类,得到多个聚类簇,包括:
4.根据权利要求2或3所述的方法,其中,所述基于所述多个聚类簇,得到所述图像聚类标记特征,包括:
5.根据权利要求1至4中任一项所述的方法,其中,所述基于所述文本提示特征和所述待处理图像,得到所述待处理图像的图像分类结果,包括:
6.根据权利要求5所述的方法,其中,所述基于所述文本提示特征和所述图像特征,得到文本重组的视觉提示特征,包括:
7.根据权利要求6所述的方法,其中,所述基于所述注意力权重矩阵、所述文本提示特征和所述图像特征,得到所述文本重组的视觉提示特征,包括:
8.根据权利要求5至7中任一项所述的方法,其中,所述基于所述文本重组的视觉提示特征和所述待处理图像,得到所述图像分类结果,包括:
9.根据权利要求8所述的方法,其中,所述对所述待处理图像进行切分,得到多个图像块,包括:
10.根据权利要求1至9中任一项所述的方法,其中,所述基于所述图像聚类标记特征和任务提示标记特征,得到文本提示特征,包括:
11.根据权利要求1至10中任一项所述的方法,其中,所述对待处理图像进行特征提取,得到图像特征,包括:
12.一种深度学习模型的训练方法,其中,所述深度学习模型包括任务提示模块,所述任务提示模块包括可调参数,所述方法包括:
13.根据权利要求12所述的方法,其中,所述基于所述样本文本提示特征、所述样本图像特征和标签,调整所述任务提示模块中的所述可调参数,得到经训练的深度学习模型,包括:
14.根据权利要求12或13所述的方法,还包括:
15.根据权利要求13所述的方法,其中,所述基于所述样本文本提示特征和所述样本图像特征,得到所述交叉损失值,包...
【专利技术属性】
技术研发人员:龙思凡,谭资昌,王井东,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。