【技术实现步骤摘要】
本专利技术属于深度学习的,特别是涉及一种基于文本分类器的图像分类方法、系统、存储介质及电子设备。
技术介绍
1、图像分类顾名思义就是一个模式分类问题,它的目标是将不同的图像,划分到不同的类别,实现最小的分类误差。总体来说,对于单标签的图像分类问题,它可以分为跨物种语义级别的图像分类、子类细粒度图像分类,以及实例级图像分类三大类别。
2、随着深度学习的发展,图像分类问题已经得到了显著的改善。深度学习模型可以自动地从大量的数据中学习到特征表示,并且能够处理高维度数据的非线性关系,这使得对于复杂的图像分类问题更加容易解决。然而,现有技术中训练图像分类模型时,通常难以收集可观的训练集,主要是标签难以收集,导致图像分类模型的训练准确度不高,无法满足实际应用的需求。
技术实现思路
1、鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于文本分类器的图像分类方法、系统、存储介质及电子设备,基于文本分类能力实现图像分类,有效提升了图像分类的效率。
2、第一方面,本专利技术提
...【技术保护点】
1.一种基于文本分类器的图像分类方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:生成文本分类器的训练数据集包括以下步骤:
3.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:基于CLIP文本编码器抽取所述类别描述的文本特征;基于CLIP图像编码器抽取待分类图像的图像特征。
4.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:所述文本分类器采用多层感知机或transformer encoder block。
5.一种基于文本分类器的图像
...【技术特征摘要】
1.一种基于文本分类器的图像分类方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:生成文本分类器的训练数据集包括以下步骤:
3.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:基于clip文本编码器抽取所述类别描述的文本特征;基于clip图像编码器抽取待分类图像的图像特征。
4.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:所述文本分类器采用多层感知机或transformer encoder block。
5.一种基于文本分类器的图像分类系统,其特征在于,所述系统包括生成模块、第一抽取模块、训练模块、第二抽取模块和分类模块;
6....
【专利技术属性】
技术研发人员:请求不公布姓名,请求不公布姓名,请求不公布姓名,
申请(专利权)人:上海蜜度蜜巢智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。