实例分割网络的训练模型及训练方法，实例分割网络技术

技术编号：26506299 阅读：20 留言：0更新日期：2020-11-27 15:34

本申请公开了一种实例分割网络的训练模型及训练方法，一种实例分割网络。本申请公开的训练模型包括：特征提取网络、检测分割头部网络、直方图头部网络和损失计算模块，该模型中的检测分割头部网络能够对特征提取网络的输出数据中的时域信息进行处理；直方图头部网络能够对特征提取网络的输出数据中的频域信息进行处理；损失计算模块能够优化特征提取网络、检测分割头部网络和直方图头部网络分别对应的训练参数。本申请同时利用时域信息和频域信息训练实例分割网络，可以提高训练精度，从而提高实例分割网络的计算精度和分割性能。相应地，本申请提供的一种实例分割网络的训练方法和一种实例分割网络，也同样具有上述技术效果。

全部详细技术资料下载

【技术实现步骤摘要】
实例分割网络的训练模型及训练方法，实例分割网络
本申请涉及机器学习
，特别涉及一种实例分割网络的训练模型及训练方法，一种实例分割网络。
技术介绍
目前，现有的实例分割网络一般用图像的时域信息进行监督训练。对于图像中的小目标而言，时域信息可表征的信息量较少，因此参与训练的特征较少，模型的训练精度可能不足，导致分割性能有所降低。因此，如何提高实例分割网络的训练精度，是本领域技术人员需要解决的问题。
技术实现思路
有鉴于此，本申请的目的在于提供一种实例分割网络的训练模型及训练方法，一种实例分割网络，以提高实例分割网络的训练精度。其具体方案如下：第一方面，本申请提供了一种实例分割网络的训练模型，包括：特征提取网络、检测分割头部网络、直方图头部网络和损失计算模块，其中；所述特征提取网络，用于对图像进行处理，以获得多个候选框；所述检测分割头部网络，用于对所述多个候选框携带的时域信息进行处理，以输出所述图像中的各个目标；所述直方图头部网络，用于对所述多个候选框携带的频域信息进行处理，以输出预测直方图；所述损失计算模块，用于计算所述目标的目标损失值和所述预测直方图的直方图损失值，并基于所述目标损失值和所述直方图损失值优化所述特征提取网络、所述检测分割头部网络和所述直方图头部网络分别对应的训练参数。优选地，所述直方图头部网络包括：目标子网和输出层；所述目标子网包括注意力子网、包括至少一个卷积层的卷积子网、包括至少一个全连接层的全连接子网中的任一个...

【技术保护点】
1.一种实例分割网络的训练模型，其特征在于，包括：特征提取网络、检测分割头部网络、直方图头部网络和损失计算模块，其中；/n所述特征提取网络，用于对图像进行处理，以获得多个候选框；/n所述检测分割头部网络，用于对所述多个候选框携带的时域信息进行处理，以输出所述图像中的各个目标；/n所述直方图头部网络，用于对所述多个候选框携带的频域信息进行处理，以输出预测直方图；/n所述损失计算模块，用于计算所述目标的目标损失值和所述预测直方图的直方图损失值，并基于所述目标损失值和所述直方图损失值优化所述特征提取网络、所述检测分割头部网络和所述直方图头部网络分别对应的训练参数。/n

【技术特征摘要】
1.一种实例分割网络的训练模型，其特征在于，包括：特征提取网络、检测分割头部网络、直方图头部网络和损失计算模块，其中；
所述特征提取网络，用于对图像进行处理，以获得多个候选框；
所述检测分割头部网络，用于对所述多个候选框携带的时域信息进行处理，以输出所述图像中的各个目标；
所述直方图头部网络，用于对所述多个候选框携带的频域信息进行处理，以输出预测直方图；
所述损失计算模块，用于计算所述目标的目标损失值和所述预测直方图的直方图损失值，并基于所述目标损失值和所述直方图损失值优化所述特征提取网络、所述检测分割头部网络和所述直方图头部网络分别对应的训练参数。

2.根据权利要求1所述的实例分割网络的训练模型，其特征在于，
所述直方图头部网络包括：目标子网和输出层；
所述目标子网包括注意力子网、包括至少一个卷积层的卷积子网、包括至少一个全连接层的全连接子网中的任一个或组合；
所述注意力子网和/或所述卷积子网，用于确定各个候选框中不同像素点之间的关系，并根据所述关系生成关系频域信息；
所述全连接子网，用于提取各个候选框中的特征频域信息；
所述输出层，用于根据所述关系频域信息和/或所述特征频域信息生成所述预测直方图。

3.根据权利要求2所述的实例分割网络的训练模型，其特征在于，
若所述目标子网包括所述注意力子网和所述卷积子网，则所述注意力子网的输出端连接于所述卷积子网的输入端；
若所述目标子网包括所述卷积子网和所述全连接子网，则所述卷积子网的输出端连接于所述全连接子网的输入端；
若所述目标子网包括所述注意力子网和所述全连接子网，则所述注意力子网的输出端连接于所述全连接子网的输入端；
若所述目标子网包括所述注意力子网、所述卷积子网和所述全连接子网，则所述注意力子网的输出端连接于所述卷积子网的输入端，所述卷积子网的输出端连接于所述全连接子网的输入端。

4.根据权利要求2所述的实例分割网络的训练模型，其特征在于，...

【专利技术属性】
技术研发人员：王立，范宝余，郭振华，赵雅倩，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人