System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,具体涉及一种识别内容标签的方法及装置。
技术介绍
1、随着互联网技术的发展,数字资产包含了许多在现实世界不存在的图像内容;为满足业务需求,通常需要对图像内容打标签,并利用打标签的图像内容来调整大模型以使得调整后的大模型实现业务需求。
2、目前仍然依赖于人工识别图像内容的标签并为图像内容打标签,但是由于数字资产中包含了海量的图像,人工对数字资产中的图像内容打标签需要耗费大量的人力和时间,打标签的效率较低和成本较高。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种识别内容标签的方法及装置,以解决依赖于人工识别图像内容的标签并为图像内容打标签这一方式存在的打标签的效率较低和成本较高等问题。
2、为实现上述目的,本专利技术实施例提供如下技术方案:
3、本专利技术实施例第一方面公开一种识别内容标签的方法,所述方法包括:
4、获取待添加标签的数字资产图像;
5、将所述数字资产图像输入预设的第一模型进行标签识别,以得到所述数字资产图像所匹配的目标宽泛标签,以及所述目标宽泛标签下与所述数字资产图像相匹配的第一细类标签;每一宽泛标签下设置有多个细类标签,所述第一模型基于样本数据训练得到;
6、将所述数字资产图像输入预设的大语言模型,获取与所述数字资产图像相匹配的第二细类标签;
7、从所述第一细类标签和所述第二细类标签中确定目标细类标签;
8、输出所述目标宽泛标签和所述目标细类
9、优选的,将所述数字资产图像输入预设的大语言模型,获取与所述数字资产图像相匹配的第二细类标签,包括:
10、将所述数字资产图像输入预设的大语言模型,结合预设的第一提问模板对所述大语言模型进行提问,使所述大语言模型输出与所述数字资产图像相匹配的多个细类标签;
11、按照所述大语言模型输出细类标签的顺序,从所述大语言模型输出的多个细类标签中取出前n个细类标签,以得到与所述数字资产图像相匹配的第二细类标签。
12、优选的,从所述第一细类标签和所述第二细类标签中确定目标细类标签,包括:
13、将所述第一细类标签和所述第二细类标签输入所述大语言模型,结合预设的第二提问模板对所述大语言模型进行提问,使所述大语言模型确定所述第一细类标签和所述第二细类标签中相同的细类标签为目标细类标签并输出所述目标细类标签。
14、优选的,输出所述目标宽泛标签和所述目标细类标签,包括:
15、按照预设的宽泛标签和细类标签的从属关系,输出至少一组标签对,每组标签对包含具有从属关系的所述目标宽泛标签和所述目标细类标签。
16、优选的,输出至少一组标签对之后,还包括:
17、向所述数字资产图像添加所述至少一组标签对。
18、本专利技术实施例第二方面公开一种识别内容标签的装置,所述装置包括:
19、获取单元,用于获取待添加标签的数字资产图像;
20、识别单元,用于将所述数字资产图像输入预设的第一模型进行标签识别,以得到所述数字资产图像所匹配的目标宽泛标签,以及所述目标宽泛标签下与所述数字资产图像相匹配的第一细类标签;每一宽泛标签下设置有多个细类标签,所述第一模型基于样本数据训练得到;
21、处理单元,用于将所述数字资产图像输入预设的大语言模型,获取与所述数字资产图像相匹配的第二细类标签;
22、确定单元,用于从所述第一细类标签和所述第二细类标签中确定目标细类标签;
23、输出单元,用于输出所述目标宽泛标签和所述目标细类标签。
24、优选的,所述处理单元包括:
25、提问模块,用于将所述数字资产图像输入预设的大语言模型,结合预设的第一提问模板对所述大语言模型进行提问,使所述大语言模型输出与所述数字资产图像相匹配的多个细类标签;
26、提取模块,用于按照所述大语言模型输出细类标签的顺序,从所述大语言模型输出的多个细类标签中取出前n个细类标签,以得到与所述数字资产图像相匹配的第二细类标签。
27、优选的,所述确定单元具体用于:将所述第一细类标签和所述第二细类标签输入所述大语言模型,结合预设的第二提问模板对所述大语言模型进行提问,使所述大语言模型确定所述第一细类标签和所述第二细类标签中相同的细类标签为目标细类标签并输出所述目标细类标签。
28、优选的,所述输出单元具体用于:按照预设的宽泛标签和细类标签的从属关系,输出至少一组标签对,每组标签对包含具有从属关系的所述目标宽泛标签和所述目标细类标签。
29、优选的,还包括:
30、打标签单元,用于向所述数字资产图像添加所述至少一组标签对。
31、基于上述本专利技术实施例提供的一种识别内容标签的方法及装置,该方法包括:获取待添加标签的数字资产图像;将数字资产图像输入第一模型进行标签识别,以得到数字资产图像所匹配的目标宽泛标签,以及目标宽泛标签下与数字资产图像相匹配的第一细类标签;将数字资产图像输入大语言模型,获取与数字资产图像相匹配的第二细类标签;从第一细类标签和第二细类标签中确定目标细类标签;输出目标宽泛标签和目标细类标签。本方案中,利用第一模型识别数字资产图像所匹配的目标宽泛标签和第一细类标签,利用大语言模型识别与数字资产图像相匹配的第二细类标签。从第一细类标签和第二细类标签中确定目标细类标签,并输出目标宽泛标签和目标细类标签。不再依赖人工来识别图像内容的标签,降低打标签的成本和提高打标签的效率。
本文档来自技高网...【技术保护点】
1.一种识别内容标签的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,将所述数字资产图像输入预设的大语言模型,获取与所述数字资产图像相匹配的第二细类标签,包括:
3.根据权利要求1所述的方法,其特征在于,从所述第一细类标签和所述第二细类标签中确定目标细类标签,包括:
4.根据权利要求1-3中任一所述的方法,其特征在于,输出所述目标宽泛标签和所述目标细类标签,包括:
5.根据权利要求4所述的方法,其特征在于,输出至少一组标签对之后,还包括:
6.一种识别内容标签的装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述处理单元包括:
8.根据权利要求6所述的装置,其特征在于,所述确定单元具体用于:将所述第一细类标签和所述第二细类标签输入所述大语言模型,结合预设的第二提问模板对所述大语言模型进行提问,使所述大语言模型确定所述第一细类标签和所述第二细类标签中相同的细类标签为目标细类标签并输出所述目标细类标签。
9.根据权利要求6-8中任一所
10.根据权利要求9所述的装置,其特征在于,还包括:打标签单元,用于向所述数字资产图像添加所述至少一组标签对。
...【技术特征摘要】
1.一种识别内容标签的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,将所述数字资产图像输入预设的大语言模型,获取与所述数字资产图像相匹配的第二细类标签,包括:
3.根据权利要求1所述的方法,其特征在于,从所述第一细类标签和所述第二细类标签中确定目标细类标签,包括:
4.根据权利要求1-3中任一所述的方法,其特征在于,输出所述目标宽泛标签和所述目标细类标签,包括:
5.根据权利要求4所述的方法,其特征在于,输出至少一组标签对之后,还包括:
6.一种识别内容标签的装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所...
【专利技术属性】
技术研发人员:王发发,
申请(专利权)人:北京爱奇艺科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。