样本标注方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:28321969 阅读:21 留言:0更新日期:2021-05-04 13:02
本申请涉及一种样本标注方法、装置、计算机设备和存储介质。所述方法包括:获取待标注样本;将待标注样本输入训练好的神经网络,通过神经网络提取得到待标注样本的深度特征矩阵;计算获得待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵;根据第一距离矩阵,从第一已标注样本中确定待标注样本的匹配样本;获取匹配样本的标签信息,将标签信息作为待标注样本的标签信息。采用本方法能够提高标注效率。

【技术实现步骤摘要】
样本标注方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种样本标注方法、装置、计算机设备和存储介质。
技术介绍
近年来,随着大数据和深度学习的发展,出现了各种各样形式的数据集。随着数据集种类的增多,数据量也随之增大。数据量的增大带来了高精度的模型,为算法在工业界的落地应用奠定了基石。然而,由于依据数据集训练模型时,需要预先对数据进行标注。现有数据标注体系主要通过人工进行标注,因此数据量的增大另一方面又使得数据标注变得异常困难,降低了标注的效率。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高标注效率的样本标注方法、装置、计算机设备和存储介质。一种样本标注方法,所述方法包括:获取待标注样本;将所述待标注样本输入训练好的神经网络,通过所述神经网络提取得到所述待标注样本的深度特征矩阵;计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵;根据所述第一距离矩阵,从所述第一已标注样本中确定所述待标注样本的匹配样本;获取所述匹配样本的标签信息,将所述标签信息作为所述待标注样本的标签信息。在其中一个实施例中,所述计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵,包括:获取第一已标注样本的深度特征矩阵;分别计算所述待标注样本的深度特征矩阵与各所述第一已标注样本的深度特征矩阵的第一欧式距离;将各所述第一欧式距离作为第一距离矩阵的矩阵元素,得到第一距离矩阵。在其中一个实施例中,所述根据所述第一距离矩阵,从所述第一已标注样本中确定所述待标注样本的匹配样本,包括:根据所述第一距离矩阵中各矩阵元素的大小,从所述第一距离矩阵中选取第一预设数量的矩阵元素;确定选取的各所述矩阵元素对应的第一已标注样本并返回给用户;接收用户从所述第一已标注样本中选择的匹配样本。在其中一个实施例中,所述方法还包括:获取训练样本,所述训练样本包括第二已标注样本和未标注样本;将所述第二已标注样本输入预设神经网络,对所述预设神经网络进行训练,得到训练好的初始神经网络;从所述未标注样本中挑选价值样本;将所述价值样本输入所述初始神经网络,迭代训练所述初始神经网络,得到训练好的神经网络。在其中一个实施例中,所述从所述未标注样本中挑选价值样本,包括:将各所述未标注样本输入至所述初始神经网络,通过所述初始神经网络提取得到各所述未标注样本的深度特征矩阵;计算获得各所述未标注样本的深度特征矩阵与各所述第二已标注样本的深度特征矩阵的第二距离矩阵;根据所述第二距离矩阵,从所述未标注样本中挑选价值样本。在其中一个实施例中,所述计算获得各所述未标注样本的深度特征矩阵与各所述第二已标注样本的深度特征矩阵的第二距离矩阵,包括:获取各所述第二已标注样本的深度特征矩阵;将任意一个所述未标注样本的深度特征矩阵分别与各所述第二已标注样本的深度特征矩阵进行组合,得到矩阵对;计算各所述矩阵对中两个深度特征矩阵的欧式距离;将各所述矩阵对的欧式距离作为第二距离矩阵的矩阵元素,得到第二距离矩阵。在其中一个实施例中,根据所述第二距离矩阵,从所述未标注样本中挑选价值样本,包括:根据所述第二距离矩阵中各所述未标注样本对应的矩阵元素的大小,分别为各所述未标注样本从对应的矩阵元素中选取第二预设数量的矩阵元素;分别计算各所述未标注样本对应第二预设数量的矩阵元素的平均值;根据各所述平均值的大小,对各所述平均值对应的未标注样本进行排序;选取排序位置大于第一阈值且小于第二阈值的未标注样本作为价值样本。一种样本标注装置,所述装置包括:获取模块,用于获取待标注样本;提取模块,用于将所述待标注样本输入训练好的神经网络,通过所述神经网络提取得到所述待标注样本的深度特征矩阵;计算模块,用于计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵;确定模块,用于根据所述第一距离矩阵,从所述第一已标注样本中确定所述待标注样本的匹配样本;标注模块,用于获取所述匹配样本的标签信息,将所述标签信息作为所述待标注样本的标签信息。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任意一项样本标注方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项样本标注方法的步骤。上述样本标注方法、装置、计算机设备和存储介质,通过结合计算机视觉,在获取到待标注样本之后,利用神经网络提取待标注样本的深度特征距离,进而根据深度特征矩阵计算距离矩阵,从而能够准确地确定待标注样本与已标注样本的相似度。进一步的,依据能够表示相似度的距离矩阵匹配对应的已标注样本,将匹配的已标注样本的标签信息作为待标注样本的标签信息,无需人工手动标注,提高了标注的效率。附图说明图1为一个实施例中样本标注方法的应用环境图;图2为一个实施例中样本标注方法的流程示意图;图3为一个实施例中训练神经网络步骤的流程示意图;图4为一个实施例中样本标注方法的流程框架图;图5为一个实施例中样本标注装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的样本标注方法,可以应用于如图1所示的应用环境中。该应用环境涉及终端102和服务器104,终端102与服务器104通过网络进行通信。当终端102接收到上传的待标注样本之后,可以由终端102单独实现上述样本标注方法。也可以由终端102将接收到的待标注样本发送至服务器104,由服务器104实现上述样本标注方法。具体地,以终端102为例,当终端102获取到待标注样本后,将待标注样本输入训练好的神经网络,通过神经网络提取得到待标注样本的深度特征矩阵。终端102计算获得待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵。终端102根据第一距离矩阵,从第一已标注样本中确定待标注样本的匹配样本。终端102获取匹配样本的标签信息,将标签信息作为待标注样本的标签信息。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种样本标注方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:步骤S202,获取待标注样本。其中,待标注样本是指当前需要进行标注的样本图像,根本文档来自技高网...

【技术保护点】
1.一种样本标注方法,所述方法包括:/n获取待标注样本;/n将所述待标注样本输入训练好的神经网络,通过所述神经网络提取得到所述待标注样本的深度特征矩阵;/n计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵;/n根据所述第一距离矩阵,从所述第一已标注样本中确定所述待标注样本的匹配样本;/n获取所述匹配样本的标签信息,将所述标签信息作为所述待标注样本的标签信息。/n

【技术特征摘要】
1.一种样本标注方法,所述方法包括:
获取待标注样本;
将所述待标注样本输入训练好的神经网络,通过所述神经网络提取得到所述待标注样本的深度特征矩阵;
计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵;
根据所述第一距离矩阵,从所述第一已标注样本中确定所述待标注样本的匹配样本;
获取所述匹配样本的标签信息,将所述标签信息作为所述待标注样本的标签信息。


2.根据权利要求1所述的方法,其特征在于,所述计算获得所述待标注样本的深度特征矩阵与各第一已标注样本的深度特征矩阵的第一距离矩阵,包括:
获取第一已标注样本的深度特征矩阵;
分别计算所述待标注样本的深度特征矩阵与各所述第一已标注样本的深度特征矩阵的第一欧式距离;
将各所述第一欧式距离作为第一距离矩阵的矩阵元素,得到第一距离矩阵。


3.根据权利要求1所述的方法,其特征在于,所述根据所述第一距离矩阵,从所述第一已标注样本中确定所述待标注样本的匹配样本,包括:
根据所述第一距离矩阵中各矩阵元素的大小,从所述第一距离矩阵中选取第一预设数量的矩阵元素;
确定选取的各所述矩阵元素对应的第一已标注样本并返回给用户;
接收用户从所述第一已标注样本中选择的匹配样本。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练样本,所述训练样本包括第二已标注样本和未标注样本;
将所述第二已标注样本输入预设神经网络,对所述预设神经网络进行训练,得到训练好的初始神经网络;
从所述未标注样本中挑选价值样本;
将所述价值样本输入所述初始神经网络,迭代训练所述初始神经网络,得到训练好的神经网络。


5.根据权利要求4所述的方法,其特征在于,所述从所述未标注样本中挑选价值样本,包括:
将各所述未标注样本输入至所述初始神经网络,通过所述初始神经网络提取得到各所述未标注样本的深度特征矩阵;
计算获得各所述未标注样本的深度特征矩阵与各所述第二已标注样本的深度特征矩阵的第二距离矩阵...

【专利技术属性】
技术研发人员:张伟华
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1