Method and device, a bag of words model optimization and image recognition, including the image recognition method: local feature vectors to acquire the test image; the local feature vector input to use bag of bag of words model optimization method after optimization; clustering according to the bag of words model in vocabulary and the weight of the clustering of vocabulary, calculation of the test image in each bag of words model in encoding residual; the encoding error of the plurality of bag of words model are sorted according to the encoding, the size of residual, judge the test image category, the way a lot of training the sample image can obtain good recognition accuracy at the same time do not need to solve most of image recognition model expansion capability is poor.
【技术实现步骤摘要】
本专利技术涉及图像识别领域,具体涉及一种词袋模型优化和图像识别的方法及装置。
技术介绍
现今,图像识别技术图像识别技术是人工智能的一个重要领域,为了编制模拟人类图像识别活动的计算机程序,提出了不同的图像识别模型,大部分图像识别模型均是基于深度学习算法,但深度学习是一种特殊的神经网络,网络层次较多,每层的节点也较多,因此深度学习模型的参数较多,大多数为百万,甚至千万级别。为了训练一个好的深度学习模型,避免过拟合,需要大量的数据做支撑。类比一下就是要解一个具有一百万个变量的方程组,需要有一百万个方程,训练样本数量巨大,训练时需要读入大量的训练数据,并反复优化模型的参数,运算复杂度较高,同时训练完成后的模型具有复杂的网络结构,同时有大量的参数,使得包含这些网络结构和所有参数数值的模型体积庞大,故在进行图像识别时,时间复杂度较高,且现有大部分图像识别模型能识别的类别固定、扩展不方便,需要在训练时指定待分类的类别,如果后期需要增加额外的训练数据或者额外的类别时,往往需要重新训练整个模型,由此可见,现有的利用神经网络模型进行图像识别的方式的识别效率较低且扩展能力较差。
技术实现思路
因此,本专利技术要解决的技术问题在于现有图像识别方法识别效率低与模型扩展能力差。有鉴于此,本专利技术提供一种词袋模型优化方法,包括:获取每一个词袋模型中的聚类词汇;将所述聚类词汇进行聚类,得到聚类中心,其中所述聚类中心的数量等于所述词袋模型的个数;统计每一个所述聚类中心下的所述聚类词汇隶属于的所述词袋模型的数量;根据所述聚类词汇隶属于的所述词袋模型的数量,计算所述词袋模型中的所述聚类词汇的权 ...
【技术保护点】
一种词袋模型优化方法,其特征在于,包括:获取每一个词袋模型中的聚类词汇;将所述聚类词汇进行聚类,得到聚类中心,其中所述聚类中心的数量等于所述词袋模型的个数;统计每一个所述聚类中心下的所述聚类词汇隶属于的所述词袋模型的数量;根据所述聚类词汇隶属于的所述词袋模型的数量,计算所述词袋模型中的所述聚类词汇的权重。
【技术特征摘要】
1.一种词袋模型优化方法,其特征在于,包括:获取每一个词袋模型中的聚类词汇;将所述聚类词汇进行聚类,得到聚类中心,其中所述聚类中心的数量等于所述词袋模型的个数;统计每一个所述聚类中心下的所述聚类词汇隶属于的所述词袋模型的数量;根据所述聚类词汇隶属于的所述词袋模型的数量,计算所述词袋模型中的所述聚类词汇的权重。2.根据权利要求1所述的方法,其特征在于,所述获取每一个词袋模型中的聚类词汇的步骤,包括:获取多个训练图像并进行分类,构成多个训练集;提取每一个训练集中的所述训练图像的所有局部特征向量;将所述局部特征向量进行聚类,得到所述词袋模型,并获取所述词袋模型的聚类词汇;重复所述提取每一个训练集中的所述训练图像的所有局部特征向量至所述将所述局部特征向量进行聚类,得到所述词袋模型,并获取所述词袋模型的聚类词汇的步骤,直至获得每一个所述词袋模型的所述聚类词汇。3.根据权利要求1所述的方法,其特征在于,所述计算所述词袋模型中的所述聚类词汇的权重的步骤,包括:所述聚类词汇的权重等于其所属的所述聚类中心的权重。4.根据权利要求3所述的方法,其特征在于,所述聚类中心的权重为:Wj=M-Mj(N-1)M]]>其中,Wj为所述聚类中心的权重;Mj为第j个聚类中心下的词汇所属的图像类别的数量;M为所有Mj的和;N为聚类中心的数量。5.根据权利要求1所述的方法,其特征在于,所述计算所述词袋模型中的所述聚类词汇的权重的步骤,包括:将所述词袋模型中的所述聚类词汇的权重进行归一化计算。6.一种图像识别方法,其特征在于,包括:获取待测试图像的局部特征向量;将所述局部特征向量输入到利用权利要求1-5所述的方法优化后的词袋模型中;根据所述词袋模型中的聚类词汇以及所述聚类词汇的权重,计算所述待测试图像在每一个所述词袋模型中的编码残差;将所述多个词袋模型的所述编码残差进行排序,根据所述编码残差的大小,判断所述待测试图像的类别。7.根据权利要求6所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。