System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于文本分类器的图像分类方法、系统、存储介质及电子设备技术方案_技高网

基于文本分类器的图像分类方法、系统、存储介质及电子设备技术方案

技术编号:42643404 阅读:14 留言:0更新日期:2024-09-06 01:39
本发明专利技术提供一种基于文本分类器的图像分类方法、系统、存储介质及电子设备,所述方法包括以下步骤:生成文本分类器的训练数据集,所述训练数据集包括图像的类别和类别描述;抽取所述类别描述的文本特征;基于所述文本特征和所述类别训练所述文本分类器;抽取待分类图像的图像特征;将所述图像特征输入训练好的文本分类器,获取所述待分类图像的类别。本发明专利技术的基于文本分类器的图像分类方法、系统、存储介质及电子设备基于文本分类能力实现图像分类,有效提升了图像分类的效率。

【技术实现步骤摘要】

本专利技术属于深度学习的,特别是涉及一种基于文本分类器的图像分类方法、系统、存储介质及电子设备


技术介绍

1、图像分类顾名思义就是一个模式分类问题,它的目标是将不同的图像,划分到不同的类别,实现最小的分类误差。总体来说,对于单标签的图像分类问题,它可以分为跨物种语义级别的图像分类、子类细粒度图像分类,以及实例级图像分类三大类别。

2、随着深度学习的发展,图像分类问题已经得到了显著的改善。深度学习模型可以自动地从大量的数据中学习到特征表示,并且能够处理高维度数据的非线性关系,这使得对于复杂的图像分类问题更加容易解决。然而,现有技术中训练图像分类模型时,通常难以收集可观的训练集,主要是标签难以收集,导致图像分类模型的训练准确度不高,无法满足实际应用的需求。


技术实现思路

1、鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于文本分类器的图像分类方法、系统、存储介质及电子设备,基于文本分类能力实现图像分类,有效提升了图像分类的效率。

2、第一方面,本专利技术提供一种基于文本分类器的图像分类方法,所述方法包括以下步骤:生成文本分类器的训练数据集,所述训练数据集包括图像的类别和类别描述;抽取所述类别描述的文本特征;基于所述文本特征和所述类别训练所述文本分类器;抽取待分类图像的图像特征;将所述图像特征输入训练好的文本分类器,获取所述待分类图像的类别。

3、在第一方面的一种实现方式中,生成文本分类器的训练数据集包括以下步骤:

4、获取图像的类别;

5、获取多个输入文本提示;所述输入文本提示用于指示获取图像的类别描述;

6、将每个类别的输入文本指示输入大语言模型,获取所述类别对应的类别描述;

7、基于所述类别和对应的类别描述构建训练数据集。

8、在第一方面的一种实现方式中,基于clip文本编码器抽取所述类别描述的文本特征;基于clip图像编码器抽取待分类图像的图像特征。

9、在第一方面的一种实现方式中,所述文本分类器采用多层感知机或transformerencoder block。

10、第二方面,本专利技术提供一种基于文本分类器的图像分类系统,所述系统包括生成模块、第一抽取模块、训练模块、第二抽取模块和分类模块;

11、所述生成模块用于生成文本分类器的训练数据集,所述训练数据集包括图像的类别和类别描述;

12、所述第一抽取模块用于抽取所述类别描述的文本特征;

13、所述训练模块用于基于所述文本特征和所述类别训练所述文本分类器;

14、所述第二抽取模块用于抽取待分类图像的图像特征;

15、所述分类模块用于将所述图像特征输入训练好的文本分类器,获取所述待分类图像的类别。

16、在第二方面的一种实现方式中,生成文本分类器的训练数据集包括以下步骤:

17、获取图像的类别;

18、获取多个输入文本提示;所述输入文本提示用于指示获取图像的类别描述;

19、将每个类别的输入文本指示输入大语言模型,获取所述类别对应的类别描述;

20、基于所述类别和对应的类别描述构建训练数据集。

21、在第二方面的一种实现方式中,基于clip文本编码器抽取所述类别描述的文本特征;基于clip图像编码器抽取待分类图像的图像特征。

22、在第二方面的一种实现方式中,所述文本分类器采用多层感知机或transformerencoder block。

23、第三方面,本专利技术提供一种电子设备,所述电子设备包括:处理器和存储器;

24、所述存储器用于存储计算机程序;

25、所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行上述的基于文本分类器的图像分类方法。

26、第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该程序被电子设备执行时实现上述的基于文本分类器的图像分类方法。

27、如上所述,本专利技术所述的基于文本分类器的图像分类方法、系统、存储介质及电子设备,具有以下有益效果:

28、(1)基于文本分类能力实现图像分类,有效提升了图像分类的效率;

29、(2)无需训练专门的图像分类器,有效降低了成本;

30、(3)智能化程度高,极具实用性。

本文档来自技高网...

【技术保护点】

1.一种基于文本分类器的图像分类方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:生成文本分类器的训练数据集包括以下步骤:

3.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:基于CLIP文本编码器抽取所述类别描述的文本特征;基于CLIP图像编码器抽取待分类图像的图像特征。

4.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:所述文本分类器采用多层感知机或transformer encoder block。

5.一种基于文本分类器的图像分类系统,其特征在于,所述系统包括生成模块、第一抽取模块、训练模块、第二抽取模块和分类模块;

6.根据权利要求5所述的基于文本分类器的图像分类系统,其特征在于:生成文本分类器的训练数据集包括以下步骤:

7.根据权利要求5所述的基于文本分类器的图像分类系统,其特征在于:基于CLIP文本编码器抽取所述类别描述的文本特征;基于CLIP图像编码器抽取待分类图像的图像特征。

8.根据权利要求5所述的基于文本分类器的图像分类系统,其特征在于:所述文本分类器采用多层感知机或transformer encoder block。

9.一种电子设备,其特征在于,所述电子设备包括:处理器和存储器;

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被电子设备执行时实现权利要求1至4中任一项所述的基于文本分类器的图像分类方法。

...

【技术特征摘要】

1.一种基于文本分类器的图像分类方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:生成文本分类器的训练数据集包括以下步骤:

3.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:基于clip文本编码器抽取所述类别描述的文本特征;基于clip图像编码器抽取待分类图像的图像特征。

4.根据权利要求1所述的基于文本分类器的图像分类方法,其特征在于:所述文本分类器采用多层感知机或transformer encoder block。

5.一种基于文本分类器的图像分类系统,其特征在于,所述系统包括生成模块、第一抽取模块、训练模块、第二抽取模块和分类模块;

6....

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名请求不公布姓名
申请(专利权)人:上海蜜度蜜巢智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1