模型的训练样本选择方法、装置及计算机设备制造方法及图纸

技术编号：26378477 阅读：21 留言：0更新日期：2020-11-19 23:47

本发明专利技术提供了一种模型的训练样本选择方法、装置及计算机设备，涉及人工智能技术领域，包括；确定训练好的模型对于各个目标类别的识别能力值；获取标签文件，所述标签文件包括多张带有类别标签的图像；针对每张图像，根据所述图像携带的所有类别标签，以及所述图像携带的类别标签对应的所述识别能力值，确定所述图像的贡献度；基于各个所述图像的贡献度对所述标签文件中的图像进行筛选，剔除贡献度低于阈值的图像。以此可以降低训练样本的数量，提升训练样本的质量，从而提升训练的效率以及训练得到的模型的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
模型的训练样本选择方法、装置及计算机设备
本专利技术涉及人工智能
，尤其是涉及一种模型的训练样本选择方法、装置及计算机设备。
技术介绍
深度学习近年来快速发展，在图像识别、目标检测等领域表现出惊人的准确性，在视觉伺服领域使用越来越广泛。深度学习需要大量的训练集进行训练，虽然现在有很多开源的深度学习数据集可以用来训练网络模型，但是对于一个特定的视觉伺服系统，需要检测的图像并不是一些常见的物体，比如本专利技术的方法用于的视觉伺服系统，其需要检测的物体是某特殊设备上的一个电源插口，这时候需要我们自己采集图像作为训练集。训练集的大小直接影响深度学习的性能，训练集太小将导致深度学习过拟合，这意味着这个深度学习模型仅适用于其训练使用的训练集，对于实际运行时采集到的新的图像将不起作用。每张训练使用的训练集图片都需要打上标签，我们模拟系统实际运行时的情景采集图像，之后人工给图像打上标签，对于庞大的训练集，人工打标签耗费大量时间，另外训练集过大又影响着训练的效率。自己采集的训练集一定会存在大量重复的或者极容易检测的图片，当神经网络训练到一定程度时，对于这种图像检测准确率已经非常高了，再用这种图像训练对检测准确率的提升作用不大。
技术实现思路
本专利技术的目的在于提供一种模型的训练样本选择方法、装置及计算机设备，以缓解了现有技术中存在的训练效率低的技术问题。第一方面，本专利技术实施例提供的一种模型的训练样本选择方法。包括：确定训练好的模型对于各个目标类别的识别能力值；获取标签文件...

【技术保护点】
1.一种模型的训练样本选择方法，其特征在于，包括：/n确定训练好的模型对于各个目标类别的识别能力值；/n获取标签文件，所述标签文件包括多张带有类别标签的图像；/n针对每张图像，根据所述图像携带的所有类别标签，以及所述图像携带的类别标签对应的所述识别能力值，确定所述图像的贡献度；/n基于各个所述图像的贡献度对所述标签文件中的图像进行筛选，剔除贡献度低于阈值的图像。/n

【技术特征摘要】
1.一种模型的训练样本选择方法，其特征在于，包括：
确定训练好的模型对于各个目标类别的识别能力值；
获取标签文件，所述标签文件包括多张带有类别标签的图像；
针对每张图像，根据所述图像携带的所有类别标签，以及所述图像携带的类别标签对应的所述识别能力值，确定所述图像的贡献度；
基于各个所述图像的贡献度对所述标签文件中的图像进行筛选，剔除贡献度低于阈值的图像。

2.根据权利要求1所述的方法，其特征在于，所述识别能力值为MAP值。

3.根据权利要求1所述的方法，其特征在于，获取标签文件的步骤，包括：
针对所述标签文件中的每张图像，统计所述图像中包括的类别标签种类的数量，以及每种类别标签的数量。

4.根据权利要求3所述的方法，其特征在于，所述图像携带的类别标签的种类与所述贡献度正相关；所述图像携带的类别标签的数量与所述贡献度正相关。

5.根据权利要求4所述的方法，其特征在于，所述识别能力值与所述贡献度负相关。

6.根据权利要求1所述的方法，其特征在于，还包括：
将剔除后的标签文件作...

【专利技术属性】
技术研发人员：苏英菲，
申请(专利权)人：东软睿驰汽车技术沈阳有限公司，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人