【技术实现步骤摘要】
目标类别识别方法、装置及可读存储介质
[0001]本专利技术涉及数据处理
,尤其涉及目标类别识别方法、装置及可读存储介质。
技术介绍
[0002]随着深度学习技术的快速发展,深度学习算法在人工智能领域得到了极其广泛的应用。分类是最常见的一种应用场景,比如表情识别、年龄识别、性别识别、场景识别、声音事件分类等等。由于softmax非常好的分类效果和相对简单的计算过程,各种分类的任务中常常用到softmax分类器。
[0003]softmax的计算过程需要进行多次以自然数e为底的指数运算,该指数运算不易在NPU(Neural
‑
Network Processing Unit,神经网络处理单元)等硬件上实现,从而影响含有softmax分类器的算法模型在NPU等硬件上的使用。
技术实现思路
[0004]本专利技术实施例提出目标类别识别方法、装置及可读存储介质和计算机程序产品,以在保证目标类别识别精度的前提下,降低目标类别识别的计算复杂度。
[0005]本专利技术实施例的技术方案 ...
【技术保护点】
【技术特征摘要】
1.一种目标类别识别方法,其特征在于,该方法包括:对输入图像进行针对每一目标类别的相关系数提取,得到目标类别相关系数向量,该向量中的每一分量分别表示输入图像与一类目标的相关系数,该向量的维数与目标类别的总类别数相同;将所述目标类别相关系数向量中的每个分量分别乘以对应的小数,得到第二相关系数向量;在第二相关系数向量中寻找最大分量,将第二相关系数向量中的每个分量分别减去该最大分量,得到第三相关系数向量;将第三相关系数向量中的每个分量分别加上预设精度后再进行取整,得到第四相关系数向量;将第四相关系数向量中小于0的各分量更新为0,得到第五相关系数向量;对于第五相关系数向量中的每个分量,分别计算以2为底数,以该分量为指数得到的幂;分别将第五相关系数向量中的每个分量对应的幂除以第五相关系数向量中的所有分量对应的幂之和,所得的各商值分别为输入图像中包含各类目标的概率。2.根据权利要求1所述的方法,其特征在于,所述对输入图像进行针对每一目标类别的相关系数提取,包括:将输入图像输入预先训练好的目标类别相关系数提取神经网络模型,该模型的输出通道数与目标类别的总类别数相同,该模型的输出即为所述目标类别相关系数向量。3.根据权利要求1所述的方法,其特征在于,所述预设精度大于或等于2。4.根据权利要求1所述的方法,其特征在于,所述将第三相关系数向量中的每个分量分别加上预设精度后再进行取整,包括:将第三相关系数向量中的每个分量分别加...
【专利技术属性】
技术研发人员:范晓,艾国,杨作兴,房汝明,向志宏,
申请(专利权)人:深圳比特微电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。