一种针对迁移学习的神经网络模型输入通道整合方法技术

技术编号：25600578 阅读：44 留言：0更新日期：2020-09-11 23:57

一种针对迁移学习的神经网络模型输入通道整合方法，首先对网络模型描述文件中的数据输入层描述进行修改，删除原数据输入层描述，增加基于图像数据列表的数据输入层描述，并将待修改的第一个卷积层重命名；然后读取神经网络模型权重文件，并对其进行修改，使对应的神经网络模型仅需要单通道数据作为输入；最后进行单通道图像数据的实时目标检测识别测试。本发明专利技术通过对经三通道训练样本数据训练的网络模型权重文件进行分析整合，形成了单通道输入的网络模型权重文件，直接在嵌入式平台部署，无需经过通道复制操作，不需要占用多余的内存空间，减轻了神经网络的计算量，降低了对信息处理资源的压力，可直接在单通道数据上完成实时目标检测识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对迁移学习的神经网络模型输入通道整合方法
本专利技术涉及一种针对迁移学习的神经网络模型输入通道整合方法，属于神经网络智能目标检测识别领域。
技术介绍
基于卷积神经网络的目标检测识别算法在模型权重训练过程中，需要大量的训练样本数据。针对某些特定应用环境，含有效目标的图像数据量较少，无法支撑算法模型训练，必须结合采用公开数据库进行预训练等操作。然而，公开数据库大多为自然采集的三通道彩色图像，因此训练出来的模型的输入也要求是三通道数据。但当前常采用的可见光、红外或雷达SAR景象数据大多为单通道，无法满足神经网路模型输入要求。在实际应用时，一种简单可行的方法是将单通道图数据复制两个通道并在通道维度拼接生成三通道数据，然而经测试，这种方法存在不可避免的缺陷：在嵌入式信息处理平台上进行图像通道复制，既占用了多余的内存空间，又增加了复制通道的处理时间，同时还增加了神经网络的计算量，对已经比较紧张的信息处理资源造成了压力，降低了整个目标检测识别系统运行的实时性。
技术实现思路
本专利技术的技术解决问题是：克服现有技术的不足，提供一种针对迁移学习的神经网络模型输入通道整合方法，生成的单通道输入网络模型和权重文件可以直接在嵌入式信息处理平台上部署，探测装置获取的原始图像数据无需经过通道复制操作，可直接在单通道数据上完成目标实时检测识别。本专利技术的技术解决方案是：一种针对迁移学习的神经网络模型输入通道整合方法，步骤如下：步骤一：对网络模型描述文件中的数据输入层描述进行修改，删除原...

【技术保护点】
1.一种针对迁移学习的神经网络模型输入通道整合方法，其特征在于步骤如下：/n步骤一：对网络模型描述文件中的数据输入层描述进行修改，删除原数据输入层描述，增加基于图像数据列表的数据输入层描述；并将待修改的第一个卷积层重命名；/n步骤二：读取神经网络模型权重文件，并对其进行修改，使对应的神经网络模型仅需要单通道数据作为输入；/n步骤三：将修改后的权重文件使用步骤一修改的网络模型描述文件进行单通道图像数据的实时目标检测识别测试，完成神经网络模型输入通道整合。/n

【技术特征摘要】
1.一种针对迁移学习的神经网络模型输入通道整合方法，其特征在于步骤如下：
步骤一：对网络模型描述文件中的数据输入层描述进行修改，删除原数据输入层描述，增加基于图像数据列表的数据输入层描述；并将待修改的第一个卷积层重命名；
步骤二：读取神经网络模型权重文件，并对其进行修改，使对应的神经网络模型仅需要单通道数据作为输入；
步骤三：将修改后的权重文件使用步骤一修改的网络模型描述文件进行单通道图像数据的实时目标检测识别测试，完成神经网络模型输入通道整合。

2.根据权利要求1所述的一种针对迁移学习的神经网络模型输入通道整合方法，其特征在于：所述步骤二的实现方法如下：
(1)根据修改所使用的处理程序语言类型，引用网络框架和数值计算库；
(2)指定改动前的神经网络模型描述文件地址input_model_path、神经网络模型权重文件地址input_weights_path和需要修改的第一层卷积名称“conv1_1”；
(3)指定改动后的神经网络模型描述文件地址output_model_path、神经网络模型权重文件地址output_weights_path和经过修改的第一层卷积名称“conv1_1C”；
(4)使用网络框架加载改变前的神经网络模型结构input_model和神经网络模型权重文件input_weights，存入结构体变量input_net；
(5)使用网络框架加载改变后的神经网络模型结构output_model和改变前的神经网络模型权重文件input_weights，存入结构体变量output_net；
(6)使用网络框架读取input_net中指定层conv1_1的权重数据，所述权重数据包括训练三通道图像样本数据集所获得的卷积系数和卷积偏置量；
(7)将步骤(6)的卷积系数在通道维度进行叠加，形成单通道卷积系数；
(8)构建新的偏置补偿矩阵BE，利用该偏置补偿矩阵BE将步骤(6)的卷积偏置量处理成单通道卷积偏置量；
(9)使用网络框架将步骤(7)、步骤(8)的计算结果赋值到output_net的指定位置，将output_net保存至output_weights_path的文件中，即修改完毕，所述output_net中指定层的权重数据为测试单通道图像样本数据的卷积系数和卷积偏置量。

3.根据权利要求2所述的一种针对迁移学习的神经网络模型输入通道整合方法，其特征在于：所述步骤(6)的权重数据中，卷积系数weights_conv1_1_data记作D...

【专利技术属性】
技术研发人员：靳松直，周斌，张辉，郝梦茜，刘严羊硕，丛龙剑，韦海萍，张聪，郑文娟，王浩，刘燕欣，高琪，
申请(专利权)人：北京航天自动控制研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人