图像分类方法、装置及终端制造方法及图纸

技术编号：18668652 阅读：28 留言：0更新日期：2018-08-14 20:44

本发明专利技术实施例提供了一种图像分类方法、装置及终端，其中所述方法包括：通过卷积神经网络确定图像对应的图像特征向量；其中，所述图像对应有文字描述信息；通过嵌入网络对所述文字描述信息进行处理，得到文字特征向量；将所述图像特征向量和文字特征向量拼接，得到图文特征向量；调用深度神经网络，根据所述深度神经网络依据所述图像特征向量、文字特征向量以及所述图文特征向量，确定所述图像对应的分类。通过本发明专利技术实施例提供的图像分类方法，能够提升图像分类的准确性。

Image classification method, device and terminal

The embodiment of the invention provides an image classification method, a device and a terminal, wherein the method comprises: determining an image feature vector corresponding to an image through a convolutional neural network; wherein the image corresponds to a text description information; and processing the text description information through an embedded network to obtain a text feature direction. The image feature vectors and the text feature vectors are stitched together to obtain the image feature vectors. The depth neural network is used to determine the corresponding classification of the image according to the image feature vectors, the text feature vectors and the text feature vectors. The image classification method provided by the embodiment of the invention can improve the accuracy of image classification.

全部详细技术资料下载

【技术实现步骤摘要】
图像分类方法、装置及终端
本专利技术涉及图像处理
，特别是涉及一种图像分类方法、装置及终端。
技术介绍
深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络作为深度学习的一个重要分支，由于其超强的拟合能力以及端到端的全局优化能力，使得其在目标检测、分类等计算机视觉任务中所得预测结果的精度大幅提升。目前对图像进行分类时，依据图像自身的特征在预定的标签体系下匹配得到图像对应的标签，依据标签确定图像所属的分类，所得分类结果准确性差。而在实际应用场景中，用户在上传一个图像之后，还会为该图像追加一段简单的文字描述，而这段文字描述对图像的分类而言，也具有一定的参考价值。可见，如何获取图像的全面信息，依据所获取的全面信息对图像进行分类以提升图像分类的准确性，是目前本领域技术人员成为待解决的问题。
技术实现思路
本专利技术实施例提供一种图像分类方法、装置及终端，以解决现有技术中存在图像分类结果准确性差的问题。依据本专利技术的一个方面，提供了一种图像分类方法，其中所述方法包括：通过卷积神经网络确定图像对应的图像特征向量；其中，所述图像对应有文字描述信息；通过嵌入网络对所述文字描述信息进行处理，得到文字特征向量；将所述图像特征向量和文字特征向量拼接，得到图文特征向量；调用深度神经网络，根据所述深度神经网络依据所述图像特征向量、文字特征向量以及所述图文特征向量，确定所述图像对应的分类。可选地，所述通过嵌入网络对所述文字描述信息进行处理，得到文字特征向量的步骤，包括：去除所述文字描述信息中的停用词，得到多个分词；针对每个所述分词，确定所述分词在文字特...

【技术保护点】
1.一种图像分类方法，其特征在于，所述方法包括：通过卷积神经网络确定图像对应的图像特征向量；其中，所述图像对应有文字描述信息；通过嵌入网络对所述文字描述信息进行处理，得到文字特征向量；将所述图像特征向量和文字特征向量拼接，得到图文特征向量；调用深度神经网络，根据所述深度神经网络依据所述图像特征向量、文字特征向量以及所述图文特征向量，确定所述图像对应的分类。

【技术特征摘要】
1.一种图像分类方法，其特征在于，所述方法包括：通过卷积神经网络确定图像对应的图像特征向量；其中，所述图像对应有文字描述信息；通过嵌入网络对所述文字描述信息进行处理，得到文字特征向量；将所述图像特征向量和文字特征向量拼接，得到图文特征向量；调用深度神经网络，根据所述深度神经网络依据所述图像特征向量、文字特征向量以及所述图文特征向量，确定所述图像对应的分类。2.根据权利要求1所述的方法，其特征在于，所述通过嵌入网络对所述文字描述信息进行处理，得到文字特征向量的步骤，包括：去除所述文字描述信息中的停用词，得到多个分词；针对每个所述分词，确定所述分词在文字特征集合中的位置信息；依据所述位置信息生成分词对应的索引数值；其中，所述文字特征集合通过对样本图像对应的文字描述信息训练得到；调用嵌入网络，由所述嵌入网络依据各所述分词对应的索引数值确定各分词对应的描述向量；将各分词对应的描述向量同维度加权平均，得到文字特征向量。3.根据权利要求1所述的方法，其特征在于，所述将所述图像特征向量和文字特征向量拼接，得到图文特征向量的步骤，包括：将所述文字特征向量和所述图像特征向量，映射为维度相同的向量；将映射后的文字特征向量和图像特征向量进行维度拼接，生成图文特征向量。4.根据权利要求1所述的方法，其特征在于，在所述通过卷积神经网络确定图像对应的图像特征向量的步骤之前，所述方法还包括：获取各样本图像；针对每个样本图像，确定所述样本图像是否对应文字描述信息；若否，确定所述样本图像对应的文字特征子集合为空；若是，去除所述文字描述信息中的停用词得到包含多个分词的描述集合；基于预设的标签体系从所述描述集合中提取出文字特征子集合；将各样本图像对应的文字特征子集合求并集，得到文字特征集合。5.根据权利要求1所述的方法，其特征在于，所述调用深度神经网络，根据所述深度神经网络依据所述图像特征向量、文字特征向量以及所述图文特征向量，确定所述图像对应的分类的步骤，包括：分别将所述图像特征向量、文字特征向量以及所述图文特征向量输入所述深度神经网络，得到与所述图像特征向量对应的第一分类结果向量，与所述文字特征向量对应的第二分类结果向量，与所述图文特征向量对应的第三分类结果向量；将所述第一分类结果向量、第二分类结果向量以及所述第三分类结果向量进行加权求和，得到目标结果向量；依据所述目标结果向量，确定所述图像对应的分类。6.一种图像分类装置，其特征在于，所述装置包括：确定模块，被配置为通过卷积神经网络确定图像对应的图像特征向量；其中，所述图像对应有文字描述信息；向量生成模块，被配置为通过嵌入网络对所述文字描述信息进行处理，得到文字特征向量；拼接模块，被配置为将所述图像特征向量和文...

【专利技术属性】
技术研发人员：张志伟，杨帆，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人