System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 图像标注方法、装置、设备以及存储介质制造方法及图纸_技高网

图像标注方法、装置、设备以及存储介质制造方法及图纸

技术编号:40319251 阅读:9 留言:0更新日期:2024-02-07 21:02
本公开提供了图像标注方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习、数据标注、自然语言处理、大语言模型以及图像处理等技术领域。具体实现方案为:利用预设标注模型对待标注的目标图像进行初始标注处理,得到目标图像中的目标对象的目标位置信息和待校验描述信息,将目标图像和提示信息输入至GPT模型中,得到对象查找结果,提示信息用于提示GPT模型根据目标描述信息在目标图像中查找目标对象和/或目标对象关联的虚构对象,目标描述信息根据待校验描述信息确定,若根据对象查找结果确定待校验描述信息校验,根据待校验描述信息和目标位置信息确定目标图像的标注信息。该技术方案可提高机器标注准确性。

【技术实现步骤摘要】

本公开涉及人工智能,尤其涉及深度学习、数据标注、自然语言处理、大语言模型以及图像处理等。


技术介绍

1、近年来,随着图像数量的剧增,人们迫切地需要实现图像内容的高效标注,以实现大规模图像的有效检索与管理。从模式识别的角度来看,将图像标注问题视为根据内容给图像分配一组标签,其中如何选取表征图像内容的合适特征,将在很大程度上影响标注性能。

2、目前,图像标注主要有两种方式,包括人工标注方式和自动化标注方式。


技术实现思路

1、本公开提供了一种图像标注方法、装置、设备以及存储介质

2、根据本公开的一方面,提供了一种图像标注方法,包括:

3、利用预设标注模型对待标注的目标图像进行初始标注处理,得到所述目标图像中的目标对象的目标位置信息和待校验描述信息;

4、将所述目标图像和目标提示信息输入至预设gpt模型中,得到对象查找结果,其中,所述目标提示信息用于提示所述预设gpt模型根据目标描述信息在所述目标图像中查找所述目标对象和/或所述目标对象关联的虚构对象,所述目标描述信息根据所述待校验描述信息确定;

5、在根据所述对象查找结果确定所述待校验描述信息校验通过的情况下,根据所述待校验描述信息和所述目标位置信息确定所述目标图像的标注信息。

6、根据本公开的另一方面,提供了一种图像标注装置,包括:

7、初始标注模块,用于利用预设标注模型对待标注的目标图像进行初始标注处理,得到所述目标图像中的目标对象的目标位置信息和待校验描述信息;

8、查找模块,用于将所述目标图像和目标提示信息输入至预设gpt模型中,得到对象查找结果,其中,所述目标提示信息用于提示所述预设gpt模型根据目标描述信息在所述目标图像中查找所述目标对象和/或所述目标对象关联的虚构对象,所述目标描述信息根据所述待校验描述信息确定;

9、标注信息确定模块,用于在根据所述对象查找结果确定所述待校验描述信息校验通过的情况下,根据所述待校验描述信息和所述目标位置信息确定所述目标图像的标注信息。

10、根据本公开的另一方面,提供了一种电子设备,包括:

11、至少一个处理器;以及

12、与所述至少一个处理器通信连接的存储器;其中,

13、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例所述的方法。

14、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开实施例所述的方法。

15、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开任意实施例所述的方法。

16、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种图像标注方法,包括:

2.根据权利要求1所述的方法,其中,所述将所述目标图像和目标提示信息输入至预设GPT模型中,得到对象查找结果,包括:

3.根据权利要求1或2所述的方法,其中,所述将所述目标图像和目标提示信息输入至预设GPT模型中,得到对象查找结果,包括:

4.根据权利要求3所述的方法,其中,所述根据所述对象查找结果确定所述待校验描述信息校验通过,包括:

5.根据权利要求1-4任一所述的方法,其中,所述利用预设标注模型对待标注的目标图像进行初始标注处理,得到所述目标图像中的目标对象的目标位置信息和待校验描述信息,包括:

6.根据权利要求1-4任一所述的方法,其中,所述利用预设标注模型对待标注的目标图像进行初始标注处理,得到所述目标图像中的目标对象的目标位置信息和待校验描述信息,包括:

7.根据权利要求6所述的方法,其中,所述初始位置信息以矩形框表示,所述满足预设融合条件的目标初始位置信息,通过以下方式确定:

8.根据权利要求6所述的方法,其中,所述初始位置信息以矩形框表示;所述对所述目标初始位置信息进行第一融合处理,包括:

9.根据权利要求5所述的方法,满足以下至少一项:

10.根据权利要求1所述的方法,其中,所述目标提示信息中包括所述目标位置信息。

11.一种图像标注装置,包括:

12.根据权利要求11所述的装置,其中,所述查找模块,包括:

13.根据权利要求11或12所述的装置,其中,所述查找模块,包括:

14.根据权利要求13所述的装置,其中,所述根据所述对象查找结果确定所述待校验描述信息校验通过,包括:

15.根据权利要求11-14任一所述的装置,其中,所述初始标注模块,包括:

16.根据权利要求11-14任一所述的装置,其中,所述初始标注模块,包括:

17.根据权利要求16所述的装置,其中,所述初始位置信息以矩形框表示,所述满足预设融合条件的目标初始位置信息,通过以下方式确定:

18.根据权利要求16所述的装置,其中,所述初始位置信息以矩形框表示;所述融合处理单元在对所述目标初始位置信息进行第一融合处理时具体用于:

19.根据权利要求15所述的装置,满足以下至少一项:

20.根据权利要求11所述的装置,其中,所述目标提示信息中包括所述目标位置信息。

21.一种电子设备,包括:

22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。

...

【技术特征摘要】

1.一种图像标注方法,包括:

2.根据权利要求1所述的方法,其中,所述将所述目标图像和目标提示信息输入至预设gpt模型中,得到对象查找结果,包括:

3.根据权利要求1或2所述的方法,其中,所述将所述目标图像和目标提示信息输入至预设gpt模型中,得到对象查找结果,包括:

4.根据权利要求3所述的方法,其中,所述根据所述对象查找结果确定所述待校验描述信息校验通过,包括:

5.根据权利要求1-4任一所述的方法,其中,所述利用预设标注模型对待标注的目标图像进行初始标注处理,得到所述目标图像中的目标对象的目标位置信息和待校验描述信息,包括:

6.根据权利要求1-4任一所述的方法,其中,所述利用预设标注模型对待标注的目标图像进行初始标注处理,得到所述目标图像中的目标对象的目标位置信息和待校验描述信息,包括:

7.根据权利要求6所述的方法,其中,所述初始位置信息以矩形框表示,所述满足预设融合条件的目标初始位置信息,通过以下方式确定:

8.根据权利要求6所述的方法,其中,所述初始位置信息以矩形框表示;所述对所述目标初始位置信息进行第一融合处理,包括:

9.根据权利要求5所述的方法,满足以下至少一项:

10.根据权利要求1所述的方法,其中,所述目标提示信...

【专利技术属性】
技术研发人员:沈智勇赵一麟戴永兴陆勤龚建
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1