一种基于生成对抗网络的图像自动文本标注方法技术

技术编号：16529409 阅读：1081 留言：0更新日期：2017-11-09 21:18

本发明专利技术公开了一种基于生成对抗网络的图像自动文本标注方法，包括以下步骤：由生成器产生假的语句，同时重新构建一个判别器，将生成的语句和真实语句输入进行训练，直至判别器无法判别出真实语句和生成语句。本发明专利技术改变了CNN‑RNN图像自动语句标注中产生句子生硬、死板的问题，并且使得生成的句子更为准确、自然、多样性，生成的语句可以面对现实中更为复杂的景象，更加符合人类的语言表达方式标注图像，在实际中有着更为广泛的应用。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络的图像自动文本标注方法
本专利技术涉及图像语句标注领域，具体涉及一种基于生成对抗网络的图像自动文本标注方法。
技术介绍
近年来，图像自动语句标注问题获得了广泛研究。由于不仅涉及图像本身的目标识别问题，还涉及到自然语言处理问题，当前主要相关方法可以总结为以下三种：语义模板填充法：此方法通过获得图像中的具体目标，将代表目标的类别文本放入一个固定自然语言生成模板中，自动生成语句。有的方法使用目标识别的结果来组成一个包含固定三个语义元素的简单句子。有的方法将识别的目标间关系也一同放入同一个模板中，组成包含更多语义的句子。特征空间匹配法：此方法提前构造了大量语句，通过将图像和构造好的语句都投射到高维的特征空间，寻找特征相近的匹配语句。有的方法构建了多个kernel，通过ranking的方式对各个数据空间的数据进行比较，以寻找其间的关系。有的方法提出通过分析图片中可能包含的噪声标题、标签或者表述，为这种特征空间映射的方法提供更多有用的信息。CNN-RNN方法：此方法通过CNN(卷积神经网络)提取图像的特征，将特征输入到一个RNN[29](循环神经网络)中，利用NLP(自然语言处理)的训练方式，训练一个语句产生模块，同时可以实现端到端的训练过程。有的方法将图像提取的特征直接输入到循环神经网络模块，传入LSTM循环神经网络，获得标注结果，该模型效果较为优秀。传统方法虽然在一定程度上可以解决标注问题，却仍然有一定缺陷：语义模板填充法：这种基于语义模板填充的图像自动文本标注算法，在一定程度上可以构建出符合模板的句子，但是在实际应用中，其语言表述能力十分薄弱...
一种基于生成对抗网络的图像自动文本标注方法

【技术保护点】
一种基于生成对抗网络的图像自动文本标注方法，其特征在于，包括以下步骤：S 101将CNN多标签分类模块和LSTM语句生成模块标注作为生成器，将LSTM语句特征提取模块和分类器标注作为判别器；S 102所述CNN多标签分类模块提取到图片的信息，然后通过LSTM语句生成模块生成语句，生成的语句为所述生成器生成的假的语句；S 103将生成的语句和真实的语句输入进行训练，所述LSTM语句特征提取模块对生成的语句和真实的语句进行训练，直至所述判别器无法判别真实语句和生成语句。

【技术特征摘要】
1.一种基于生成对抗网络的图像自动文本标注方法，其特征在于，包括以下步骤：S101将CNN多标签分类模块和LSTM语句生成模块标注作为生成器，将LSTM语句特征提取模块和分类器标注作为判别器；S102所述CNN多标签分类模块提取到图片的信息，然后通过LSTM语句生成模块生成语句，生成的语句为所述生成器生成的假的语句；S103将生成的语句和真实的语句输入进行训练，所述LSTM语句特征提取模块对生成的语句和真实的语句进行训练，直至所述判别器无法判别真实语句和生成语句。2.根据权利要求1所述的基于生成对抗网络的图像自动文本标注方法，其特征在于，S103中还包括通过所述判别器判别通过所述生成器生成的语句是否描述图片的方法，包括以下步骤：S201将所述生成器生成的句子记为Sfake,真实的句子记为Sreal,训练的一张图片记为Imatch，引入一张不匹配的图片记为Imismatch；S202生成语句Sfake和真实语句Sreal由LSTM语句特征提取模块进行特征提取，提取到的特征、M...

【专利技术属性】
技术研发人员：胡伏原，吕凡，沈军宇，孙钰，李林燕，李宏，
申请(专利权)人：苏州科技大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人