一种图像检测模型的多尺度anchor初始化方法与装置制造方法及图纸

技术编号：26480204 阅读：30 留言：0更新日期：2020-11-25 19:25

本发明专利技术涉及一种图像检测模型的多尺度anchor初始化方法，方法包括：将每种待检测图像对应的样本标签划分到对应的尺度内；根据每个尺度内的样本标签数量阈值，判断是否保留尺度；确定保留的每个尺度下的样本标签面积和宽高情况；根据样本标签面积和宽高情况，动态调整anchor数量并生成每个尺度下的初始化anchor；通过评价指标比较面积和宽高两种方法确定的anchor的情况，选择较达到评价指标的一组结果。本发明专利技术生成的初始化anchor既能够指导算法采用最合适的尺度，节省效率，避免尺度间的竞争；又能够与样本的分布情况一致，提升检测精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像检测模型的多尺度anchor初始化方法与装置
本申请涉及互联网
，尤其涉及一种图像检测模型的多尺度anchor初始化方法与装置。
技术介绍
目标检测算法(Detection)是深度学习计算机视觉(CV)领域一个非常重要的方向，算法过程是通过一系列带有标签的图像进行训练，提取目标特征，用于预测新的图像是否含目标并用矩形框标示，对目标图像进行标注，带有标签的图像的矩形框为目标矩形框。如图1所示，含有三个目标。目标检测训练过程中，Anchor需要设置有多个参数，其中非常重要的一个参数就是锚框(anchor)，其形态是矩形框。其原理是将一系列(常见的是9个)初始化的anchor做为基准，找到IoU(锚框和目标矩形框的面积交集/并集，如图2所示)和目标矩形框最接近的一个，并学习锚框和目标矩形框之间的变换关系。这种学习可近似看作线性变换，所以初始化的anchor和目标矩形框越接近，学习的效果越好，预测精度会越高。其中，目标矩形框，即标注的矩形框，通常称为标签。Anchor由两个参数构成，数量和大小。其中，anchor的数量一般会影响生成初始化anchor的效率，也在一定程度上影响检测精度。anchor的大小会影响最终检测结果的准确程度，即anchor初始大小与数据集标签尺寸约接近越好，但标注的矩形的数量远大于anchor数量，所以如何让初始化的anchor框的分布能够与标注的矩形框的分布保持一致(距离最小)并且采用合理的anchor数量是该算法要解决的主要问题之一。
技术实现思路
>本申请提供了一种图像检测模型的多尺度anchor初始化方法与装置，以解决如何让初始化的anchor框的分布能够与标注的矩形框的分布保持一致(距离最小)并且采用合理的anchor数量的问题。本申请采用的技术方案如下：本申请提供了一种图像检测模型的多尺度anchor初始化方法，所述方法包括：将每种待检测图像对应的样本标签划分到对应的尺度内；根据每个所述尺度内的样本标签数量阈值，判断是否保留所述尺度；确定保留的每个尺度下的样本标签面积和宽高情况；根据所述样本标签面积和宽高情况，确定anchor数量并生成所述尺度下的初始化anchor。进一步地，将每种待检测图像对应的样本标签划分到对应的尺度内，包括：根据尺度阈值，将每种待检测图像对应的样本标签划分到对应的尺度内，所述尺度阈值为样本标签面积范围，所述样本标签面积范围为通过实验获取的能够对所述尺度下的样本标签有最佳检测结果的范围。进一步地，根据所述样本标签面积情况，确定anchor数量并生成所述尺度下的初始化anchor，包括：根据每个尺度下的样本标签面积和宽高情况，通过不同的聚类的距离计算方式和动态调整anchor数量方法，生成所述尺度下的初始化anchor。进一步地，根据每个尺度下的样本标签面积和宽高情况，通过不同的聚类的距离计算方式和动态调整anchor数量方法，生成所述尺度下的初始化anchor，包括以下步骤：根据每个尺度下的样本标签的面积排序，在每个尺度下等距离的选取预设数量的样本标签作为初始化聚类中心；分别根据样本标签的面积和宽高两方面进行聚类的计算；根据面积和宽高的聚类计算方法，两方面进行计算样本标签与所有初始化聚类中心的距离，将所述样本标签分类到距离最近的初始化聚类中心；根据所述标签分类步骤生成的新的初始化聚类中心，取平均值作为新聚类中心；计算每一类样本标签与新聚类中心距离的标准偏差和计算每一类别样本标签间的新聚类中心的距离，选择增加或者减小聚类中心个数；通过面积和宽高两种距离的计算方法，得到的两组不同的聚类结果中，判断聚类中心个数是否变化；若聚类中心个数不变化，则通过类内和类间的评价指标，从两组不同的聚类结果中，选取达到评价指标的一组聚类中心，作为初始化anchor。进一步地，通过面积和宽高两种距离的计算方法，得到的两组不同的聚类结果中，判断聚类中心个数是否变化，包括：通过面积和宽高两种距离的计算方法，得到的两组不同的聚类结果中，判断聚类中心个数是否变化；若聚类中心个数变化，则再次进行根据面积和宽高的聚类计算方法，两方面进行计算样本标签与所有初始化聚类中心的距离，将所述样本标签分类到距离最近的初始化聚类中心、根据所述标签分类步骤生成的新的初始化聚类中心，取平均值作为新聚类中心、计算每一类样本标签与新聚类中心距离的标准偏差和计算每一类别样本标签间的新聚类中心的距离，选择增加或者减小聚类中心个数，直至聚类中心个数不再变化。进一步地，计算每一类样本标签与新聚类中心距离的标准偏差和计算每一类别样本标签间的新聚类中心的距离，选择增加或者减小聚类中心个数，包括：计算每一类样本标签与聚类中心距离的标准偏差，与类内阈值比较，若大于阈值，则增加新聚类中心个数；计算每一类别样本标签间的聚类中心的距离，若小于类间阈值，则减小新聚类中心个数。进一步地，一种图像检测模型的多尺度anchor初始化装置，所述装置包括：多尺度划分模块，用于将每种待检测图像对应的样本标签划分到对应的尺度内，并判断是否要保留该尺度；生成初始化anchor模块，用于根据每个尺度下的样本标签面积和宽高情况，确定anchor数量以及生成所述尺度下的初始化anchor。进一步地，所述多尺度划分模块，用于根据尺度阈值，将每种图像对应的样本标签划分到合适的尺度内，再根据每个尺度内的样本标签数量阈值，判断是否要保留该尺度；所述尺度阈值为样本标签面积范围，所述样本标签面积为通过实验获取的能够对所述尺度下的样本标签有最佳检测结果的范围。进一步地，所述生成初始化anchor模块模块，包括：聚类中心初始化单元，用于根据每个尺度下的样本标签的面积排序，在每个尺度下等距离的选取预设数量的样本标签作为初始化聚类中心；距离计算单元，用于分别根据样本标签的面积和宽高两方面进行聚类的计算；标签分类单元，用于根据面积和宽高的聚类计算方法，两方面进行计算样本标签与所有初始化聚类中心的距离，将所述样本标签分类到距离最近的初始化聚类中心；聚类中心更新单元，用于根据所述标签分类步骤生成的新的初始化聚类中心，取平均值作为新聚类中心；动态调整聚类中心个数单元，用于计算每一类样本标签与新聚类中心距离的标准偏差和计算每一类别样本标签间的新聚类中心的距离，选择增加或者减小聚类中心个数；聚类中心判断单元，用于通过面积和宽高两种距离的计算方法，得到的两组不同的聚类结果中，判断聚类中心个数是否变化；聚类中心选择单元，用于确定聚类中心个数不再变化，并通过类内和类间的评价指标，从两组不同的聚类结果中，选取达到评价指标的一组聚类中心，作为初始化anchor。进一步地，所述动态调整聚类中心个数单元，用于计算每一类标签与聚类中心距离的标准偏差，与类内阈值比较，若大于阈值，则增加聚类中心个数；本文档来自技高网...

【技术保护点】
1.一种图像检测模型的多尺度anchor初始化方法，其特征在于，所述方法包括：/n将每种待检测图像对应的样本标签划分到对应的尺度内；/n根据每个所述尺度内的样本标签数量阈值，判断是否保留所述尺度；/n确定保留的每个尺度下的样本标签面积和宽高情况；/n根据所述样本标签面积和宽高情况，确定anchor数量并生成所述尺度下的初始化anchor。/n

【技术特征摘要】
1.一种图像检测模型的多尺度anchor初始化方法，其特征在于，所述方法包括：
将每种待检测图像对应的样本标签划分到对应的尺度内；
根据每个所述尺度内的样本标签数量阈值，判断是否保留所述尺度；
确定保留的每个尺度下的样本标签面积和宽高情况；
根据所述样本标签面积和宽高情况，确定anchor数量并生成所述尺度下的初始化anchor。

2.根据权利要求1所述的图像检测模型的多尺度anchor初始化方法，其特征在于，将每种待检测图像对应的样本标签划分到对应的尺度内，包括：
根据尺度阈值，将每种待检测图像对应的样本标签划分到对应的尺度内，
所述尺度阈值为样本标签面积范围，所述样本标签面积范围为通过实验获取的能够对所述尺度下的样本标签有最佳检测结果的范围。

3.根据权利要求1所述的图像检测模型的多尺度anchor初始化方法，其特征在于，根据所述样本标签面积和宽高情况，确定anchor数量并生成所述尺度下的初始化anchor，包括：
根据每个尺度下的样本标签面积和宽高情况，通过不同的聚类的距离计算方式和动态调整anchor数量方法，生成所述尺度下的初始化anchor。

4.根据权利要求3所述的图像检测模型的多尺度anchor初始化方法，其特征在于，根据每个尺度下的样本标签面积和宽高情况，通过不同的聚类的距离计算方式和动态调整anchor数量方法，生成所述尺度下的初始化anchor，包括以下步骤：
根据每个尺度下的样本标签的面积排序，在每个尺度下等距离的选取预设数量的样本标签作为初始化聚类中心；
分别根据样本标签的面积和宽高两方面进行聚类的计算；
根据面积和宽高的聚类计算方法，两方面进行计算样本标签与所有初始化聚类中心的距离，将所述样本标签分类到距离最近的初始化聚类中心；
根据所述标签分类步骤生成的新的初始化聚类中心，取平均值作为新聚类中心；
计算每一类样本标签与新聚类中心距离的标准偏差和计算每一类别样本标签间的新聚类中心的距离，选择增加或者减小聚类中心个数；
通过面积和宽高两种距离的计算方法，得到的两组不同的聚类结果中，判断聚类中心个数是否变化；
若聚类中心个数不变化，则通过类内和类间的评价指标，从两组不同的聚类结果中，选取达到评价指标的一组聚类中心，作为初始化anchor。

5.根据权利要求1所述的图像检测模型的多尺度anchor初始化方法，其特征在于，通过面积和宽高两种距离的计算方法，得到的两组不同的聚类结果中，判断聚类中心个数是否变化，包括：
通过面积和宽高两种距离的计算方法，得到的两组不同的聚类结果中，判断聚类中心个数是否变化；
若聚类中心个数变化，则再次进行根据面积和宽高的聚类计算方法，两方面进行计算样本标签与所有初始化聚类中心的距离，将所述样本标签分类到距离最近的初始化聚类中心、根据所述标签分类步骤生成的新的初始化聚类中心，取平均值作为新聚类中心、计算每一类样本标签与新聚...

【专利技术属性】
技术研发人员：刘铎，
申请(专利权)人：北京凌云光技术集团有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人