基于情感融合与特征权重引导的幽默风格图像描述方法技术

技术编号：43675441 阅读：38 留言：0更新日期：2024-12-18 20:59

本发明专利技术公开了一种基于情感融合与特征权重引导的幽默风格图像描述方法，首先采用多层卷积与池化操作对输入图像提取其幽默特征向量；同时给定具有人类情感信息的情感图像，使用卷积神经网络构建情感标志向量；将幽默特征向量与情感标志向量实施特征融合组成联合特征向量，通过线性组合变换实现维度对齐后映射进入长短期记忆网络中。在每个时间步捕获与特定输入位置相关的幽默视觉信息，逐个生成单词并最终组成完整的图像描述。对于所生成的图像描述，综合考虑幽默图像描述的组织数据，对该幅被描述图像的联合特征进行权重强化引导。以生成图像描述的幽默程度为收益对模型进行参数微调，从而提高模型对幽默风格图像描述的细粒度生成。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于深度学习与计算机视觉，尤其涉及一种基于情感融合与特征权重引导的幽默风格图像描述方法。

技术介绍

1、图像描述作为结合人工智能领域中的计算机视觉和自然语言处理的交叉领域，要求计算机能准确且流畅地用自然语言描述图像中的内容。随着互联网和通信技术的发展，海量的图片含义推理需求广泛存在，通过对图像信息与文本信息建立关系,使得计算机能够识别图像的语义信息，并生成相应的人们可以理解的自然语言文本。深度学习在各个领域的应用越来越多，并表现出比传统技术更好的性能。随着深度学习模型的不断发展，图像描述在多样性和自然性方面都有了很好的改进。特别是在幽默图像描述方面，借助深度学习模型可以自动地从输入数据中提取新的特征，实现人类独有的高级情感功能：引人发笑的幽默。

2、作为图像描述的拓展延伸，关注图像描述是否有趣，需要理解图像。理解图像通常需要解释物体与其位置之间的关系、存在内容的意图，并将视觉信息与先验知识联系起来。幽默图像描述需要高水平的认知抽象，需要上下文意识和对不协调的识别。幽默是一种抽象、主观且依赖语境的认知结构，涉及多个认...

【技术保护点】

1.一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，步骤1具体为：输入具有情感倾向要素的情感图像进入一个删除了最后一个Softmax层的Inception-v3网络，提取出一组特征向量，成为幽默特征向量；公式表达为：

3.根据权利要求1所述的一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，步骤2具体为：输入具有情感倾向要素的情感图像进入两层使用ReLU激活函数的卷积层，再通过一个最大值池化层，最后通过两个使用ReLU激活函...

【技术特征摘要】

1.一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，步骤1具体为：输入具有情感倾向要素的情感图像进入一个删除了最后一个softmax层的inception-v3网络，提取出一组特征向量，成为幽默特征向量；公式表达为：

3.根据权利要求1所述的一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，步骤2具体为：输入具有情感倾向要素的情感图像进入两层使用relu激活函数的卷积层，再通过一个最大值池化层，最后通过两个使用relu激活函数的全连接层，提取出情感标志向量；

4.根据权利要求1所述的一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，步骤3具体为：对幽默特征向量与情感标志向量实施特征拼接，得到联合特征向量；

5.根据权利要求1所述的一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，步骤4具体为：首先计算每层输入数据与权值生成的新数据并传递到下一层，然后与相同的权值结合生成重构数据，映射回输入层，通过不断缩小输入数据与重构数据之间的误差，训练每层网络。

6.根据权利要求1所述的一种基于情感融合与特征权重引导的幽默风格图像描述方法，其特征在于，步骤5具体为：对于齐后的联合特征向量，映射进入长短期记忆网络，以得到的联合特征向量为特征输入，通过选择所有特征向量的子集选择性聚焦于图像的部分，学习权重向量的投影，学习对输入分量的权重做计算，学习对记忆存储的贡献，学习擦除存储单元的权重，最终控制...

【专利技术属性】
技术研发人员：郑钰辉，杨钧茗，张国庆，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人