识别图像的方法、装置、集群和存储介质制造方法及图纸

技术编号：40563420 阅读：13 留言：0更新日期：2024-03-05 19:26

本申请提供了一种识别图像的方法、装置、集群和存储介质，属于图像识别技术领域。该方法包括：获取用户输入的待识别图像，获取该待识别图像对应的第一标签信息，基于该第一标签信息，使用预训练的图像识别模型对该待识别图像进行识别，获得该待识别图像的识别结果，该识别结果至少包括标签，该识别结果包括的标签属于该第一标签信息。采用本申请，能够使得图像识别的扩展性比较好。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像识别，特别涉及一种识别图像的方法、装置、集群和存储介质。

技术介绍

1、图像的标签作为图像内容理解最基础的能力，只有标签识别准确，下游应用才能对图像进行处理。例如，下游应用使用标签对图像进行归档、搜索或推荐等。

2、相关技术中，通常是用户提出标签需求，提供服务方分析用户的标签需求，提供服务方收集大量的业务数据，使用业务数据进行模型定制化训练，获得能够识别图像的标签的模型，然后进行模型部署。在模型部署完成后，使用该模型识别图像的标签。然而随着用户业务变化，若标签发生改变，则需要重新训练模型，使得图像识别的扩展性比较差。

技术实现思路

1、本申请提供了一种识别图像的方法、装置、集群和存储介质，能够提升图像识别的扩展性。

2、第一方面，本申请提供了一种识别图像的方法，该方法包括：获取用户输入的待识别图像，获取该待识别图像对应的第一标签信息，基于该第一标签信息，使用预训练的图像识别模型对该待识别图像进行识别，获得该待识别图像的识别结果，该识别结果至少包括标签，该识别结果包括的标签属于该第一标签信息。

3、本申请所示的方案，在对待识别图像进行识别时，获取待识别图像对应的标签信息，然后使用标签信息和预训练的图像识别模型对待识别图像进行识别，使得识别出的待识别图像的标签属于获取的标签信息中。这样，在标签发生变化后，还可以使得识别出的标签属于指定的标签信息中，而不需要重新训练模型，能够提升图像识别的扩展性。

4、在一些可能的实现方式中，

5、在一些可能的实现方式中，该获取该待识别图像对应的第一标签信息，包括：获取用户输入的与待识别图像对应的第二标签信息，将该第二标签信息，确定为该待识别图像对应的第一标签信息；或者，对该第二标签信息进行标签扩充，以获得标签扩充后的标签信息，将该标签扩充后的标签信息，确定为该待识别图像对应的第一标签信息。

6、本申请所示的方案，用户在输入待识别图像时，同时输入标签信息，可以直接将用户输入的标签信息，确定为待识别图像对应的标签信息，也可以对用户输入的标签信息进行标签扩充，将标签扩充后的标签信息，确定为待识别图像对应的标签信息。

7、在一些可能的实现方式中，该获取用户输入的待识别图像之前，还包括：接收该用户输入的第二标签信息，将该第二标签信息，确定为与该用户的注册信息关联的标签信息，或者，对该第二标签信息进行标签扩充，以获得标签扩充后的标签信息，将该标签扩充后的标签信息，确定为与该用户的注册信息关联的标签信息，该获取该待识别图像对应的第一标签信息，包括：确定该用户的注册信息关联的标签信息，将该用户的注册信息关联的标签信息，确定为该待识别图像对应的第一标签信息。

8、本申请所示的方案，用户在输入待识别图像前，输入标签信息，可以直接将用户输入的标签信息，确定为用户的注册信息关联的标签信息，也可以对用户输入的标签信息进行标签扩充，将标签扩充后的标签信息，确定为用户的注册信息关联的标签信息。后续在接收到用户输入的待识别图像后，将用户的注册信息关联的标签信息，确定为待识别图像对应的标签信息。这样，能够使得标签信息和待识别图像异步输入。

9、在一些可能的实现方式中，该对该第二标签信息进行标签扩充，以获得标签扩充后的标签信息之后，还包括：生成该标签扩充后的标签信息的确认界面，该确认界面用于向该用户展示该标签扩充后的标签信息，接收该用户输入的确认指令，该确认指令用于对该标签扩充后的标签信息进行确认。

10、本申请所示的方案，在对标签信息进行标签扩充后，用户还可以确认标签扩充后的标签信息，使得识别出的待识别图像的标签符合用户的需求。

11、在一些可能的实现方式中，该基于该第一标签信息，使用预训练的图像识别模型对该待识别图像进行识别，获得该待识别图像的识别结果，包括：将该第一标签信息包括的每个标签分别与该待识别图像输入该图像识别模型，获得该待识别图像的图像内容与该每个标签的相似度，基于该待识别图像的图像内容与该每个标签的相似度，获得该待识别图像的识别结果。

12、本申请所示的方案，可以使用每个标签与待识别图像内容的相似度，确定待识别图像的识别结果，使得待识别图像的识别结果中包括的标签属于指定的标签。

13、在一些可能的实现方式中，该图像识别模型包括标签特征子模型和图像特征子模型，该将该第一标签信息包括的每个标签分别与该待识别图像输入该图像识别模型，获得该待识别图像的图像内容与该每个标签的相似度，包括：使用该标签特征子模型，提取该每个标签的特征，并使用该图像特征子模型，提取该待识别图像的特征，将该每个标签的特征与该待识别图像的特征之间的距离，确定为该待识别图像的图像内容与该每个标签的相似度。

14、本申请所示的方案，图像识别模型包括标签特征子模型和图像特征子模型，使用两个子模型分别提取标签与待识别图像的特征，通过计算提取的特征之间的距离，获得待识别图像的图像内容与该每个标签的相似度，这样，能够准确计算出待识别图像的图像内容与该每个标签的相似度，进而能够获得待识别图像的准确识别结果。

15、在一些可能的实现方式中，该基于该待识别图像的图像内容与该每个标签的相似度，获得该待识别图像的识别结果，包括：将该第一标签信息包括的标签中置信度高于目标阈值的标签，确定为该待识别图像的识别结果，或者，将该第一标签信息包括的标签中置信度从高到低排序的前目标数值个标签，确定为该待识别图像的识别结果。

16、在一些可能的实现方式中，该第二标签信息包括标签列表，或者，该第二标签信息包括标签种类列表。

17、在一些可能的实现方式中，该获取用户输入的待识别图像，包括：通过应用程序接口(application program interface，api)或者交互界面，接收该用户输入的该待识别图像，该接收该用户输入的第二标签信息，包括：通过api或者交互界面，接收该用户输入的第二标签信息。

18、本申请所示的方案，提供了多种输入待识别图像和第二标签信息的方式。

19、第二方面，本申请提供了一种识别图像的装置，该装置具有实现上述第一方面的功能。该装置包括至少一个模块，至少一个模块用于实现上述第一方面或第一方面任一些可能的实现方式所述的方法。

20、第三方面，本申请提供了一种计算设备集群，所述计算设备集群至少一个计算设备，每个计算设备包括处理器和存储器；所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令，以使得所述计算设备集群执行上述第一方面或第一方面中任一些可能的实现方式所述的方法。

21、第四方面，本申请提供了一种可读存储介质，包括计算机程序指令，当所述计算机程序指令由计算设备集群执行时，所述计算设备集群执行上述第一方面或第一方面中任一些可能的实现方式所述的方法。

22、第五方面，本本文档来自技高网...

【技术保护点】

1.一种识别图像的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一标签信息是基于所述用户输入的第二标签信息确定的，或者是默认的标签信息。

3.根据权利要求2所述的方法，其特征在于，所述获取所述待识别图像对应的第一标签信息，包括：

4.根据权利要求2所述的方法，其特征在于，所述获取用户输入的待识别图像之前，还包括：

5.根据权利要求3或4所述的方法，其特征在于，所述对所述第二标签信息进行标签扩充，以获得标签扩充后的标签信息之后，还包括：

6.根据权利要求1至5任一项所述的方法，其特征在于，所述基于所述第一标签信息，使用预训练的图像识别模型对所述待识别图像进行识别，获得所述待识别图像的识别结果，包括：

7.根据权利要求6所述的方法，其特征在于，所述图像识别模型包括标签特征子模型和图像特征子模型，所述将所述第一标签信息包括的每个标签分别与所述待识别图像输入所述图像识别模型，获得所述待识别图像的图像内容与所述每个标签的相似度，包括：

8.根据权利要求6或7所述的方法，其

9.根据权利要求1至8任一项所述的方法，其特征在于，所述第二标签信息包括标签列表；或者，所述第二标签信息包括标签种类列表。

10.根据权利要求4或5所述的方法，其特征在于，所述获取用户输入的待识别图像，包括：

11.一种识别图像的装置，其特征在于，所述装置包括：

12.根据权利要求11所述的装置，其特征在于，所述第一标签信息是基于所述用户输入的第二标签信息确定的，或者是默认的标签信息。

13.根据权利要求12所述的装置，其特征在于，所述识别模块，用于：

14.根据权利要求12所述的装置，其特征在于，所述交互模块，还用于：

15.根据权利要求13或14所述的装置，其特征在于，所述交互模块，还用于：

16.根据权利要求11至15任一项所述的装置，其特征在于，所述识别模块，用于：

17.根据权利要求16所述的装置，其特征在于，所述图像识别模型包括标签特征子模型和图像特征子模型，所述识别模块，用于：

18.根据权利要求16或17所述的装置，其特征在于，所述识别模块，用于：

19.根据权利要求14或15所述的装置，其特征在于，所述交互模块，用于：

20.一种计算设备集群，其特征在于，包括至少一个计算设备，每个计算设备包括处理器和存储器；

21.一种计算机可读存储介质，其特征在于，包括计算机程序指令，当所述计算机程序指令由计算设备集群执行时，所述计算设备集群执行如权利要求1至10任一项所述的方法。

...

【技术特征摘要】

1.一种识别图像的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一标签信息是基于所述用户输入的第二标签信息确定的，或者是默认的标签信息。

3.根据权利要求2所述的方法，其特征在于，所述获取所述待识别图像对应的第一标签信息，包括：

4.根据权利要求2所述的方法，其特征在于，所述获取用户输入的待识别图像之前，还包括：

5.根据权利要求3或4所述的方法，其特征在于，所述对所述第二标签信息进行标签扩充，以获得标签扩充后的标签信息之后，还包括：

8.根据权利要求6或7所述的方法，其特征在于，所述基于所述待识别图像的图像内容与所述每个标签的相似度，获得所述待识别图像的识别结果，包括：

9.根据权利要求1至8任一项所述的方法，其特征在于，所述第二标签信息包括标签列表；或者，所述第二标签信息包括标签种类列表...

【专利技术属性】
技术研发人员：杨乐，喻晓源，房超，
申请(专利权)人：华为云计算技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人