样本标注方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：28321969 阅读：21 留言：0更新日期：2021-05-04 13:02

本申请涉及一种样本标注方法、装置、计算机设备和存储介质。所述方法包括：获取待标注样本；将待标注样本输入训练好的神经网络，通过神经网络提取得到待标注样本的深度特征矩阵；计算获得待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵；根据第一距离矩阵，从第一已标注样本中确定待标注样本的匹配样本；获取匹配样本的标签信息，将标签信息作为待标注样本的标签信息。采用本方法能够提高标注效率。

全部详细技术资料下载

【技术实现步骤摘要】
样本标注方法、装置、计算机设备和存储介质
本申请涉及计算机
，特别是涉及一种样本标注方法、装置、计算机设备和存储介质。
技术介绍
近年来，随着大数据和深度学习的发展，出现了各种各样形式的数据集。随着数据集种类的增多，数据量也随之增大。数据量的增大带来了高精度的模型，为算法在工业界的落地应用奠定了基石。然而，由于依据数据集训练模型时，需要预先对数据进行标注。现有数据标注体系主要通过人工进行标注，因此数据量的增大另一方面又使得数据标注变得异常困难，降低了标注的效率。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够提高标注效率的样本标注方法、装置、计算机设备和存储介质。一种样本标注方法，所述方法包括：获取待标注样本；将所述待标注样本输入训练好的神经网络，通过所述神经网络提取得到所述待标注样本的深度特征矩阵；计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵；根据所述第一距离矩阵，从所述第一已标注样本中确定所述待标注样本的匹配样本；获取所述匹配样本的标签信息，将所述标签信息作为所述待标注样本的标签信息。在其中一个实施例中，所述计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵，包括：获取第一已标注样本的深度特征矩阵；分别计算所述待标注样本的深度特征矩阵与各所述第一已标注样本的深度特征矩阵的第一欧式距离；将各所述第一欧式距离作为第一距离矩阵...

【技术保护点】
1.一种样本标注方法，所述方法包括：/n获取待标注样本；/n将所述待标注样本输入训练好的神经网络，通过所述神经网络提取得到所述待标注样本的深度特征矩阵；/n计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵；/n根据所述第一距离矩阵，从所述第一已标注样本中确定所述待标注样本的匹配样本；/n获取所述匹配样本的标签信息，将所述标签信息作为所述待标注样本的标签信息。/n

【技术特征摘要】
1.一种样本标注方法，所述方法包括：
获取待标注样本；
将所述待标注样本输入训练好的神经网络，通过所述神经网络提取得到所述待标注样本的深度特征矩阵；
计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵；
根据所述第一距离矩阵，从所述第一已标注样本中确定所述待标注样本的匹配样本；
获取所述匹配样本的标签信息，将所述标签信息作为所述待标注样本的标签信息。

2.根据权利要求1所述的方法，其特征在于，所述计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵，包括：
获取第一已标注样本的深度特征矩阵；
分别计算所述待标注样本的深度特征矩阵与各所述第一已标注样本的深度特征矩阵的第一欧式距离；
将各所述第一欧式距离作为第一距离矩阵的矩阵元素，得到第一距离矩阵。

3.根据权利要求1所述的方法，其特征在于，所述根据所述第一距离矩阵，从所述第一已标注样本中确定所述待标注样本的匹配样本，包括：
根据所述第一距离矩阵中各矩阵元素的大小，从所述第一距离矩阵中选取第一预设数量的矩阵元素；
确定选取的各所述矩阵元素对应的第一已标注样本并返回给用户；
接收用户从所述第一已标注样本中选择的匹配样本。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：
获取训练样本，所述训练样本包括第二已标注样本和未标注样本；
将所述第二已标注样本输入预设神经网络，对所述预设神经网络进行训练，得到训练好的初始神经网络；
从所述未标注样本中挑选价值样本；
将所述价值样本输入所述初始神经网络，迭代训练所述初始神经网络，得到训练好的神经网络。

5.根据权利要求4所述的方法，其特征在于，所述从所述未标注样本中挑选价值样本，包括：
将各所述未标注样本输入至所述初始神经网络，通过所述初始神经网络提取得到各所述未标注样本的深度特征矩阵；
计算获得各所述未标注样本的深度特征矩阵与各所述第二已标注样本的深度特征矩阵的第二距离矩阵...

【专利技术属性】
技术研发人员：张伟华，
申请(专利权)人：顺丰科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人