一种提升图像识别准确率的方法技术

技术编号：14945042 阅读：401 留言：0更新日期：2017-04-01 11:30

本发明专利技术公开了一种提升图像识别准确率的方法，采用词嵌入技术，分析图片的关联文字，提升图像识别的准确率；步骤有：图片、文字描述对的提取；对于图像，采用深度学习技术，训练神经网络识别；对于图像识别，取前m项识别结果，参与后续处理；通过名词识别技术识别出文字里的名词序列；词向量的训练与计算；采用词向量近似度对图像识别结果进行过滤来提升识别准确性。本发明专利技术采用词嵌入技术，来分析图片的关联文字，以此提升了图像识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理
，尤其涉及一种提升图像识别准确率的方法。
技术介绍
2006年来，采用深度神经网络(DNN)的“深度学习”(DeepLearning)技术开始受到学术界广泛关注，今天已经成为互联网大数据和人工智能的一个热潮。深度学习通过建立类似于人脑的分层模型结构，对输入数据逐级提取从底层到高层的特征，从而能很好地建立从底层信号到高层语义的映射关系，是机器智能领域最近这十年来最大进展，在图像识别领域的最大突破。采用深度学习对图像进行归类时，通常来说，对一个图片，会给出一系列识别结果及其概率。然而，图像并不是孤零零的存在的。对于新闻图片，除了图片，有新闻标题和新闻内容。新闻标题和新闻内容是和新闻图片里的内容密切相关的。对于电商图片，通常有所售商品的标题描述，这些文字描述和商品图片是密切相关的。现有技术方法是采用深度学习等技术，识别图像得出识别结果。对于新闻图像或电商图像，往往配有文字描述，现有识别技术，并没有利用上这些文字描述信息。本专利技术利用文字描述信息，来移除深度学习技术识别的候选结果里和文字描述关联度低的候选结果，达到提高识别准确性的目的
技术实现思路
本专利技术的目的在于提供一种提升图像识别准确率的方法，旨在解决现有识别技术，没有利用新闻图像或电商图像配有的文字描述信息，不能移除现有技术识别的候选结果里和文字描述关联度低的候选结果，不能提高准确性的识别问题。本专利技术是这样实现的，一种提升图像识别准确率的方法，所述提升图像识别准确率的方法采用词嵌入技术，计算图像识别的候选结果与说明文字的关联度(用最小距离来表征)，去除关联度低的候选结果...

【技术保护点】
一种提升图像识别准确率的方法，其特征在于，所述提升图像识别准确率的方法采用词嵌入技术，计算图像识别的候选结果与说明文字的关联度，去除关联度低的候选结果，提升图像识别的准确率；具体步骤如下：图片、文字描述对的提取；对于图像，采用深度学习技术，训练神经网络识别，识别结果为类别概率序列(C1，P1)，(C2，P2)，……(Cn,Pn)，所述类别概率序列按照概率排序，具体为P1≥P2≥……≥Pn；采用的神经网络有但不限于AlexNet，GoogLeNet，VGG，Inception，ResNet；对于图像识别，取前m项识别结果(C1，P1)，(C2，P2)，……(Cm,Pm)(m≤n)，参与后续处理；对于描述文字，通过名词识别技术识别出文字里的名词序列，对名词序列进行去掉重复的名词后得到的名词序列记为N1,N2,…Nk；词向量的训练与计算；采用词向量近似度对图像识别结果进行过滤来提升识别准确性。

【技术特征摘要】
1.一种提升图像识别准确率的方法，其特征在于，所述提升图像识别准确率的方法采用词嵌入技术，计算图像识别的候选结果与说明文字的关联度，去除关联度低的候选结果，提升图像识别的准确率；具体步骤如下：图片、文字描述对的提取；对于图像，采用深度学习技术，训练神经网络识别，识别结果为类别概率序列(C1，P1)，(C2，P2)，……(Cn,Pn)，所述类别概率序列按照概率排序，具体为P1≥P2≥……≥Pn；采用的神经网络有但不限于AlexNet，GoogLeNet，VGG，Inception，ResNet；对于图像识别，取前m项识别结果(C1，P1)，(C2，P2)，……(Cm,Pm)(m≤n)，参与后续处理；对于描述文字，通过名词识别技术识别出文字里的名词序列，对名词序列进行去掉重复的名词后得到的名词序列记为N1,N2,…Nk；词向量的训练与计算；采用词向量近似度对图像识别结果进行过滤来提升识别准确性。2.如权利要求1所述的提升图像识别准确率的方法，其特征在于，所述图片、文字描述对的提取包括：a)对于新闻图片，提取新闻标题，将提取的新闻标题作为对新闻图片的文字描述；b)对于电商图片，提取电商产品的描述，将提取的电商产品的描述作为对电商图片的文字描述。3.如权利要求1所述的提升图像识别准确率的方法，其特征在于，所述词向量的训练与计算包括：1)采用新闻语料，训练新闻词向量模型；采用电商语料，训练电商词向量模型；选择对应的词向量模型计算名词序列的词向量；2)计算名词序列N1,N2,…Nk的词向量，记为Vn1,Vn2,…Vnk；3)计算类别序列C1,C2,…Cm的词向量，记为Vc1,Vc2,…Vcm。4.如权利要求1所述的提升图像识别准确率的方法，其特征在于，所述采用词向量近似度对图像识别结果进行过滤来提升识别准确性包括：(1)记两个词向量V1，V2之间的近似度为dv1,v2；近似度...

【专利技术属性】
技术研发人员：程国艮，李欣杰，
申请(专利权)人：中译语通科技北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人