【技术实现步骤摘要】
类别识别方法、装置、设备、存储介质及程序产品
[0001]本申请实施例涉及计算机
,尤其涉及一种类别识别方法
、
装置
、
设备
、
存储介质及程序产品
。
技术介绍
[0002]目前,应用于大规模的图像审核技术上的视觉识别系统,主流的实现方式是基于深度学习的方法
。
该方法需要积累较大的数据量才能保证模型有较好的泛化能力和实际应用价值
。
其要求从大量的数据中获取所关注的正样本,此类正样本在应用到大规模的审核数据上时往往需要数十万或者数万的累积量,在一些训练数据中未曾明确定义的类别识别上,相关技术中,通过人工收集更多所关注这一类的数据缓解数据不足,同时进一步训练一个单独的视觉识别模型,通过该种方式实现对新类别的有效识别
。
[0003]上述方案中,采用重新训练识别模型的方式,需要投入大量的人力成本和时间成本,如耗费大量的标注时间成本,特别是在关注的正样本占比极小
(
如不到百万分之一
)
的情况下,需要获得足够多数量的正样本需要标注数百万甚至数千万的数据,在实际应用中时间和人力成本十分高昂,需要改进
。
技术实现思路
[0004]本申请实施例提供了一种类别识别方法
、
装置
、
设备
、
存储介质及程序产品,能够极大的节省时间成本和人力成本,提高了类别识别效率
。
[0005]第一方面,本 ...
【技术保护点】
【技术特征摘要】
1.
类别识别方法,其特征在于,包括:获取图片样本集和文本样本集,所述图片样本集中的图片样本与所述文本样本集中的文本样本具有不同的关联关系;基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练;将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到所述类别信息在所述待识别图片中的匹配图片
。2.
根据权利要求1所述的类别识别方法,其特征在于,在所述获取图片样本集和文本样本集之前,还包括:获取网站信息中的图片以及文字描述信息;基于所述图片以及所述文字描述信息生成图片样本集与文本样本集,以及所述图片样本集中图片样本与所述文本样本集中文本样本的关联关系
。3.
根据权利要求1所述的类别识别方法,其特征在于,所述基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练,包括:对所述图片样本集中的图片样本进行图片标准化处理得到标准图片,以及对所述文本样本集中的文本进行文本标准化处理得到标准文本;分别将所述标准图片以及所述标准文本输入至设置的图片编码网络与文本编码网络,得到所述标准图片对应的图片向量以及所述标准文本对应的文本向量;计算所述图片向量与所述文本向量的相似度,并基于所述图片样本与所述文本样本的关联关系对所述图片编码网络和所述文本编码网络进行训练得到训练完成的识别模型
。4.
根据权利要求3所述的类别识别方法,其特征在于,所述标准图片包括预设大小的张量矩阵,所述标准文本包括预设维度的矩阵
。5.
根据权利要求3所述的类别识别方法,其特征在于,所述计算所述图片向量与所述文本向量的相似度,并基于所述图片样本与所述文本样本的关联关系对所述图片编码网络和所述文本编码网络进行训练得到训练完成的识别模型,包括:通过设置的相似度计算公式计算所述图片向量与所述文本向量的相似度;基于所述相似度以及所述图片样本与所述文本样本的关联关系进行...
【专利技术属性】
技术研发人员:陈祥,
申请(专利权)人:百果园技术新加坡有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。