图片识别方法及装置制造方法及图纸

技术编号：16038686 阅读：67 留言：0更新日期：2017-08-19 20:32

本发明专利技术公开了一种图片识别方法及装置，属于图像识别技术领域。所述方法包括：获取待识别图片；获取已训练的SHNN模型，SHNN由多个已训练的HNN模型聚合得到；根据已训练的SHNN模型，对待识别图片进行识别，得到待识别图片的类别概率向量，类别概率向量包括待识别图片属于每种类别的类别概率，每种类别的类别概率为多个参考类别概率向量的每一维度上的元素的平均值，多个参考类别概率向量由多个HNN模型对待识别图片识别得到；根据类别概率向量，确定待识别图片的类别。由于本发明专利技术采用已训练的SHNN模型对待识别图片进行识别，而该已训练的SHNN模型由多个已训练的HNN模型聚合得到，因此，不仅能够保证识别精度，而且大大地缩短了识别过程所消耗的时间。

全部详细技术资料下载

【技术实现步骤摘要】
图片识别方法及装置
本专利技术涉及图像识别
，特别涉及一种图片识别方法及装置。
技术介绍
随着互联网技术的发展及搜索引擎的不断完善，用户已不满足于单一的文字检索方式，更多时候要求搜索引擎能够检索出与所输入图片相似的相似图片，而在此之前，需要搜索引擎能够识别出图片。目前，搜索引擎主要通过训练CNN(ConvolutionalNeuralNetwork，卷积神经网络)模型，并基于已训练的CNN模型对图片进行识别。具体过程为：获取待识别图片和多个已训练的CNN模型；根据每个已训练的CNN模型，提取待识别图片的特征向量，并对提取的特征向量进行处理，得到多个参考类别概率向量，每个参考类别概率向量包括待识别图片属于每种类别的参考类别概率，且每一维度上的元素表示一种参考类别概率；计算多个参考类别概率向量在同一维度上的元素的平均值，得到每种类别的类别概率；将所有类别的类别概率组成类别概率向量；根据该类别概率向量，确定待识别图片的类别。由于需要根据多个已训练的CNN模型对待识别图片进行识别，且需要将多个参考类别概率向量每一维度上的元素进行聚合，因而整个识别过程耗时较长。专利技...
图片识别方法及装置

【技术保护点】
一种图片识别方法，其特征在于，所述方法包括：获取待识别图片；获取已训练的浅学习哈希神经网络SHNN模型，所述SHNN由多个已训练的哈希神经网络HNN模型聚合得到；根据所述已训练的SHNN模型，对所述待识别图片进行识别，得到所述待识别图片的类别概率向量，所述类别概率向量包括所述待识别图片属于每种类别的类别概率，每种类别的类别概率为多个参考类别概率向量的每一维度上的元素的平均值，所述多个参考类别概率向量由所述多个HNN模型对所述待识别图片识别得到；根据所述类别概率向量，确定所述待识别图片的类别。

【技术特征摘要】
1.一种图片识别方法，其特征在于，所述方法包括：获取待识别图片；获取已训练的浅学习哈希神经网络SHNN模型，所述SHNN由多个已训练的哈希神经网络HNN模型聚合得到；根据所述已训练的SHNN模型，对所述待识别图片进行识别，得到所述待识别图片的类别概率向量，所述类别概率向量包括所述待识别图片属于每种类别的类别概率，每种类别的类别概率为多个参考类别概率向量的每一维度上的元素的平均值，所述多个参考类别概率向量由所述多个HNN模型对所述待识别图片识别得到；根据所述类别概率向量，确定所述待识别图片的类别。2.根据权利要求1所述的方法，其特征在于，所述获取已训练的浅学习哈希神经网络SHNN模型之前，还包括：获取多个训练图片，每个训练图片标注有初始类别；根据所述多个训练图片，对多个待训练的HNN模型进行训练，得到所述多个已训练的HNN模型；对所述多个已训练的HNN模型进行聚合，得到所述已训练的SHNN模型。3.根据权利要求2所述的方法，其特征在于，所述对所述多个已训练的HNN模型进行聚合，得到所述已训练的SHNN模型，包括：获取多个建模图片；对于任一建模图片，根据每个已训练的HNN模型，对所述建模图片进行识别，得到所述建模图片对应的多个参考类别概率向量；计算所述建模图片对应的多个参考类别概率向量在同一维度上的元素的平均值，得到所述建模图片对应的类别概率向量；根据所述建模图片对应的类别概率向量，确定所述建模图片的初始类别；根据多个添加了初始类别的建模图片，对任一待训练的HNN模型进行训练，得到所述已训练的SHNN模型。4.根据权利要求1所述的方法，其特征在于，所述方法还包括：根据所述已训练的SHNN模型，提取所述待识别图片的特征向量，并将所提取的特征向量映射为二值哈希码，所述二值哈希码为由0或1组成的字符串；计算图片数据库中存储的每个图片的二值哈希码与所述二值哈希码之间的海明距离；如果任一图片的二值哈希码与所述二值哈希码之间的海明距离小于第一预设数值，则确定所述图片为所述待识别图片的相似图片。5.根据权利要求4所述的方法，其特征在于，所述将所提取的特征向量映射为二值哈希码，包括：将所述特征向量中每一维度上的元素转换为一个S型值，得到与所述特征向量维度数量相同的多个S型值；如果任一S型值大于第二预设数值，则将所述S型值映射为1；如果所述S型值小于所述第二预设数值，则将所述S型值映射为0；按照所述特征向量中每一维度的元素顺序，将所述多个S型值所映射的0或1组成字符串，得到所述二值哈希码。6.根据权利要求1所述的方法，其特征在于，所述方法还包括：如果所述待识别图片具有相机视锥模型FOV标签，则根据所述FOV标签，确定至少一个目标地标，所述FOV标签包括拍摄位置、拍摄方向角、可视夹角及最大可视距离；计算每个目标地标的捕捉概率；根据所述至少一个目标地标的捕捉概率，对所述待识别图片的类别概率向量进行更新。7.根据权利要求6所述的方法，其特征在于，所述根据所述FOV标签，确定至少一个目标地标，包括：根据所述拍摄位置，确定多个可选地标；根据所述拍摄方向角、可视夹角及最大可视距离，从所述多个可选地标中，选取所述至少一个目标地标。8.根据权利要求6所述的方法，其特征在于，所述根据所述至少一个目标地标的捕捉概率，对所述待识别图片的类别概率向量进行更新，包括：计算所述至少一个目标地标和所述类别概率向量中同一类别对应的捕捉概率和类别概率的概率平均值；根据每种类别的概率平均值，对所述待识别图片的类别概率向量进行更新。9.一种图片...

【专利技术属性】
技术研发人员：彭湃，郭晓威，
申请(专利权)人：腾讯科技上海有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人