一种基于网络结构搜索的图像描述生成方法技术

技术编号：37538609 阅读：15 留言：0更新日期：2023-05-12 16:07

本发明专利技术公开一种基于网络结构搜索的图像描述生成方法，包括以下步骤：使用网络结构优化方法基于图像分类任务搜索卷积单元，获得普通卷积与规约池化单元结构；使用搜索出的单元结构构建出模型结构，并将模型结构基于图像分类数据集进行训练；使用搜索训练得到的卷积单元模型结构构建视觉注意力模型，应用于图像描述生成任务；基于束搜索对得到的上述应用于图像描述生成任务的视觉注意力模型进行解码与评估，实现图像描述的生成。本发明专利技术解决了当前网络结构搜索技术在各领域重量级任务上应用不足的问题，成功地将网络结构优化方法基于轻量级图像分类任务搜索的卷积结构单元应用到更复杂的图像理解任务中，有效减少模型的参数量，提升相应任务的性能。提升相应任务的性能。提升相应任务的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于网络结构搜索的图像描述生成方法

[0001]本专利技术涉及一种自然语言处理领域的图像描述生成方法，具体为一种基于网络结构搜索的图像描述生成方法。

技术介绍

[0002]网络结构搜索(Neural Architecture Search，NAS)是自动机器学习(Automated Machine Learning，AutoML)的一个重要的分支，尤其在人工智能正在向高效智能迈进的时期，这个领域的发展显得有更加独特的意义。在自动机器学习领域中，研究人员进行繁琐手动调整的时间被大大减少，转而采用数据驱动的决策方式，由机器自动地决定出最佳的学习策略。
[0003]传统的机器学习流程中，针对不同的任务、不同的数据，研究人员都要完成特征提取、模型设计等一系列工作才能进行下一步，即模型的训练与调优。随着深度学习研究方向的诞生与发展，机器学习从业者逐渐地从特征设计提取的工作中摆脱出来，此类工作更多地交付给模型去处理。但对于模型设计的工作，相关的研究人员还是需要花费大量的宝贵时间去设计出适用的神经网络并进行不断的实验尝试，借以调整超参数并优化其中的细节。与此同时，这种人工模型设计的方式对研究人员理解任务的程度依赖较大，也会受到其思想知识的某些局限性限制，即使经过大量的实验测试与验证，设计出的模型也不能确保达到最优，因此目前许多基于深度学习的方法对相关领域的专家依旧有着较强的依赖性。
[0004]网络结构搜索能够排除上述流程中模型设计工作对人工的过分依赖，能够有效降低难以接受的人工试错与时间成本。它采用网络结构自...

【技术保护点】

【技术特征摘要】
1.一种基于网络结构搜索的图像描述生成方法，其特征在于包括以下步骤：1)使用网络结构优化方法基于图像分类任务搜索卷积单元，获得普通卷积与规约池化单元结构；2)使用搜索出的单元结构构建出模型结构，并将模型结构基于图像分类数据集进行训练；3)使用搜索训练得到的卷积单元模型结构构建视觉注意力模型，应用于图像描述生成任务；4)基于束搜索对得到的上述应用于图像描述生成任务的视觉注意力模型进行解码与评估，实现图像描述的生成。2.按照权利要求1所述的一种基于网络结构搜索的图像描述生成方法，其特征在于：在步骤1)具体过程为：101)随机生成多个卷积结构加入结构池，使用搜索控制器的单层LSTM编码器对每一个卷积结构进行嵌入编码，将离散的卷积结构映射到连续空间中，并对每一个离散的卷积结构进行训练以及模型性能的评估；102)使用评估后的卷积结构及模型性能数据对训练搜索的控制器；103)挑选多个性能优秀的卷积结构，在其基础上使用控制器的性能预测器函数f基于编码器的隐藏层状态派生出新的卷积结构嵌入表示e
x
′
：e
x
′
＝{h
′1,h
′2,
…
,h
′
T
}其中h
t
为编码器的隐藏层状态，e
x
′
为派生...

【专利技术属性】
技术研发人员：刘兴宇，姜炎宏，
申请(专利权)人：沈阳雅译网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人