一种嵌入式智能加速器的多模态图像数据识别方法及系统技术方案

技术编号：39032189 阅读：12 留言：0更新日期：2023-10-10 11:45

本发明专利技术提出一种嵌入式智能加速器的多模态图像数据识别方法和系统，包括：获取由光学图像和遥感图像构成的图像对，每个图像对中的光学图像已标注训练标签；通过卷积神经网络模型分别提取图像对中光学图像和遥感图像的特征，得到光学图像的光学特征和遥感图像的遥感特征；将光学特征与遥感特征卷积后，得到互相关特征，将互相关特征输入至图像语义分割模型，在互相关特征的向量维度上，检测光学图像内包含遥感图像的检测区域；根据检测区域与光学图像已标注的训练标签，构建损失函数训练图像语义分割模型和卷积神经网络模型；以执行图像数据识别任务。像数据识别任务。像数据识别任务。

全部详细技术资料下载

【技术实现步骤摘要】
一种嵌入式智能加速器的多模态图像数据识别方法及系统

[0001]本专利技术涉及人工智能以及图像语义识别分类
，并特别涉及一种嵌入式智能加速器的多模态图像数据识别方法及系统。

技术介绍

[0002]多模态数据识别是指通过计算机系统识别、分类和处理多种数据模式的过程。多模态数据模式包括文本、图像、声音、视频等。多模态数据识别技术在许多领域有广泛的应用，例如自然语言处理、图像处理、视频分析、语音识别等。这些技术能够提高信息处理的效率，并为人们提供更多便捷的信息服务。随着人工智能技术的发展，多模态数据识别技术也在不断提升，未来将会发挥更大的作用。
[0003]国产的嵌入式智能加速器是指在国内研制、生产的智能加速器。智能加速器是一种用于加速人工智能计算的硬件设备，常用于深度学习和机器学习等人工智能应用。近年来，国内的智能加速器研究取得了长足的进步。许多国内企业和研究机构已经开发出了自主知识产权的嵌入式智能加速器产品。这些产品的性能和效率均较高，在国内外市场上具有较大的竞争力。总的来看，国产智能加速器的研究现状较好，具有较强的发展潜力。
[0004]本专利技术中多模态数据特指遥感图像和光学图像。遥感图像是指通过卫星、飞机等远程感测所获得的图像数据。遥感图像具有高分辨率和大尺度等优点，但由于感测距离较远，图像的光谱信息较少。光学图像是指通过光学摄影机或相机获得的图像数据。光学图像具有高光谱信息和高空间分辨率，但图像尺度较小，无法满足大尺度的需求。
[0005]深度学习在遥感图像和光学图像双输入特征向量...

【技术保护点】

【技术特征摘要】
1.一种嵌入式智能加速器的多模态图像数据识别方法，其特征在于，包括：步骤1、获取由光学图像和遥感图像构成的多个图像对，且每个图像对中的光学图像已标注其与遥感图像画面间中具有对应关系的区域，作为训练标签；步骤2、通过卷积神经网络模型分别提取该图像对中光学图像和遥感图像的特征，得到该光学图像的光学特征和该遥感图像的遥感特征；步骤3、将该光学特征与该遥感特征卷积后，得到互相关特征，将该互相关特征输入至图像语义分割模型，在该互相关特征的向量维度上，检测该光学图像内包含该遥感图像的区域，作为检测区域；步骤4、根据该检测区域与该光学图像已标注的训练标签，构建损失函数训练该图像语义分割模型和该卷积神经网络模型；步骤5、将待识别的图像对输入训练完成后的该卷积神经网络模型和该图像语义分割模型，得到该待识别的图像对中光学图像和遥感图像的图片区域对应关系。2.如权利要求1所述的嵌入式智能加速器的多模态图像数据识别方法，其特征在于，该图像对中遥感图像和光学图像具有相同被摄区域，光学图像视野大于遥感图像。3.如权利要求1所述的嵌入式智能加速器的多模态图像数据识别方法，其特征在于，该步骤3包括：通过下式提取互相关特征R(u)：R(u)＝f(t)*g(t)，其中*表示卷积，反映的是f(t)和g(t)在不同的相对位置上互相匹配的程度，t为特征向量的维度，f(t)表示光学特征向量，g(t)表示遥感特征向量；在经过全连接层、通道压缩、阈值筛选操作，在光学图像中检测出遥感图像的该检测区域。4.如权利要求1所述的嵌入式智能加速器的多模态图像数据识别方法，其特征在于，该步骤4的训练过程包括通过前向计算的结果与实际标签结果按照损失函数进行计算，通过梯度下降方法跟新网络模型参数。5.一种嵌入式智能加速器的多模态图像数据识别系统，其特征在于，包括：模块1，用于获取由光学图像和遥感图像构成的多个图像对...

【专利技术属性】
技术研发人员：张韩宾，赵二虎，
申请(专利权)人：上海处理器技术创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人