类别识别方法技术

技术编号:39667669 阅读:14 留言:0更新日期:2023-12-11 18:31
本申请实施例提供了一种类别识别方法

【技术实现步骤摘要】
类别识别方法、装置、设备、存储介质及程序产品


[0001]本申请实施例涉及计算机
,尤其涉及一种类别识别方法

装置

设备

存储介质及程序产品


技术介绍

[0002]目前,应用于大规模的图像审核技术上的视觉识别系统,主流的实现方式是基于深度学习的方法

该方法需要积累较大的数据量才能保证模型有较好的泛化能力和实际应用价值

其要求从大量的数据中获取所关注的正样本,此类正样本在应用到大规模的审核数据上时往往需要数十万或者数万的累积量,在一些训练数据中未曾明确定义的类别识别上,相关技术中,通过人工收集更多所关注这一类的数据缓解数据不足,同时进一步训练一个单独的视觉识别模型,通过该种方式实现对新类别的有效识别

[0003]上述方案中,采用重新训练识别模型的方式,需要投入大量的人力成本和时间成本,如耗费大量的标注时间成本,特别是在关注的正样本占比极小
(
如不到百万分之一
)
的情况下,需要获得足够多数量的正样本需要标注数百万甚至数千万的数据,在实际应用中时间和人力成本十分高昂,需要改进


技术实现思路

[0004]本申请实施例提供了一种类别识别方法

装置

设备

存储介质及程序产品,能够极大的节省时间成本和人力成本,提高了类别识别效率

[0005]第一方面,本申请实施例提供了一种类别识别方法,该方法包括:
[0006]获取图片样本集和文本样本集,所述图片样本集中的图片样本与所述文本样本集中的文本样本具有不同的关联关系;
[0007]基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练;
[0008]将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到所述类别信息在所述待识别图片中的匹配图片

[0009]第二方面,本申请实施例还提供了一种类别识别装置,包括:
[0010]获取模块,配置为获取图片样本集和文本样本集,所述图片样本集中的图片样本与所述文本样本集中的文本样本具有不同的关联关系;
[0011]训练模块,配置为基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练;
[0012]识别模块,配置为将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到所述类别信息在所述待识别图片中的匹配图片

[0013]第三方面,本申请实施例还提供了一种类别识别设备,该设备包括:
[0014]一个或多个处理器;
[0015]存储装置,用于存储一个或多个程序,
[0016]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理
器实现本申请实施例所述的类别识别方法

[0017]第四方面,本申请实施例还提供了一种存储计算机可执行指令的非易失性存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本申请实施例所述的类别识别方法

[0018]第五方面,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中,设备的至少一个处理器从计算机可读存储介质读取并执行计算机程序,使得设备执行本申请实施例所述的类别识别方法

[0019]本申请实施例中,通过获取图片样本集和文本样本集,其中,图片样本集中的图片样本与文本样本集中的文本样本具有不同的关联关系,基于图片样本集以及文本样本集对设置的识别模型进行训练,将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到类别信息在待识别图片中的匹配图片

上述的类别识别方式中,利用基于图片和文本的训练数据训练得到的识别模型确定出和设置的类别方式对应的匹配图片,无需针对具体的类别进行单独的模型训练,同时本方案对识别模型的训练过程中,无需进行样本的标注,能够节省大量的时间和人力成本,且模型的识别准确度高,其更加贴近使用场景,通用性更强

附图说明
[0020]图1为本申请实施例提供的一种类别识别方法的流程图;
[0021]图2为本申请实施例提供的一种识别模型训练方法的流程图;
[0022]图3为本申请实施例提供的一种识别模型中的网络结构示意图;
[0023]图4为本申请实施例提供的一种基于生成的关联关系进行模型训练的方法的流程图;
[0024]图5为本申请实施例提供的另一种类别识别方法的流程图;
[0025]图6为本申请实施例提供的一种类别识别装置的结构框图;
[0026]图7为本申请实施例提供的一种类别识别设备的结构示意图

具体实施方式
[0027]下面结合附图和实施例对本申请实施例作进一步的详细说明

可以理解的是,此处所描述的具体实施例仅仅用于解释本申请实施例,而非对本申请实施例的限定

另外还需要说明的是,为了便于描述,附图中仅示出了与本申请实施例相关的部分而非全部结构

[0028]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序

应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个

此外,说明书以及权利要求中“和
/
或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系

[0029]本申请实施例提供的类别识别方法,执行主体可以是计算设备,如笔记本电脑

台式机以及智能终端设备等,该类别识别方法可应用于直播行业中的视频

图片的审核过程
中,对新增类别给出相匹配的图片的应用场景

[0030]图1为本申请实施例提供的一种类别识别方法的流程图,如图1所示,具体包括如下步骤:
[0031]步骤
S101、
获取图片样本集和文本样本集,所述图片样本集中的图片样本与所述文本样本集中的文本样本具有不同的关联关系

[0032]在一个实施例中,进行识别模型的训练前,获取存储的图片样本集和文本样本集,其中,图片样本集包括多个图片,文本样本集包括多个文本

针对文本样本集包含的文本可以是词和句子等组成的自然语言描述文本

其中,图片样本集中的图片样本与文本样本集中的文本样本具有不同的关联关系

可选的,该关联关系可以是二分法划分的关联或不关联的关系
。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
类别识别方法,其特征在于,包括:获取图片样本集和文本样本集,所述图片样本集中的图片样本与所述文本样本集中的文本样本具有不同的关联关系;基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练;将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到所述类别信息在所述待识别图片中的匹配图片
。2.
根据权利要求1所述的类别识别方法,其特征在于,在所述获取图片样本集和文本样本集之前,还包括:获取网站信息中的图片以及文字描述信息;基于所述图片以及所述文字描述信息生成图片样本集与文本样本集,以及所述图片样本集中图片样本与所述文本样本集中文本样本的关联关系
。3.
根据权利要求1所述的类别识别方法,其特征在于,所述基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练,包括:对所述图片样本集中的图片样本进行图片标准化处理得到标准图片,以及对所述文本样本集中的文本进行文本标准化处理得到标准文本;分别将所述标准图片以及所述标准文本输入至设置的图片编码网络与文本编码网络,得到所述标准图片对应的图片向量以及所述标准文本对应的文本向量;计算所述图片向量与所述文本向量的相似度,并基于所述图片样本与所述文本样本的关联关系对所述图片编码网络和所述文本编码网络进行训练得到训练完成的识别模型
。4.
根据权利要求3所述的类别识别方法,其特征在于,所述标准图片包括预设大小的张量矩阵,所述标准文本包括预设维度的矩阵
。5.
根据权利要求3所述的类别识别方法,其特征在于,所述计算所述图片向量与所述文本向量的相似度,并基于所述图片样本与所述文本样本的关联关系对所述图片编码网络和所述文本编码网络进行训练得到训练完成的识别模型,包括:通过设置的相似度计算公式计算所述图片向量与所述文本向量的相似度;基于所述相似度以及所述图片样本与所述文本样本的关联关系进行...

【专利技术属性】
技术研发人员:陈祥
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1