【技术实现步骤摘要】
样本标注方法、装置及计算机存储介质
[0001]本申请实施例涉及数据处理
,特别涉及一种样本标注方法、装置及计算机存储介质。
技术介绍
[0002]在人工智能的实际应用过程中,需要针对模型预测准确性较差的情况,补充相关的训练数据以提升模型的预测效果,然而,若针对对应于所有情况的所有待标注数据进行标注,则需要投入大量的人力以及时间成本。
[0003]因此,如何从大量待标注数据中获取对模型增益最大的高质量的样本,以提升样本标注效率,进而提升模型的预测精度,减少人力成本,是当前亟需解决的技术课题。
技术实现思路
[0004]鉴于上述问题,本申请提供一种样本标注方法、装置及计算机存储介质,可获取对模型训练增益最大的高质量样本,以减少人工标注成本,并提高样本标注效率。
[0005]本申请第一方面提供一种样本标注方法,包括:基于各特征类别,针对候选样本执行预测,获得所述候选样本对应于各特征类别的各预测结果;根据所述候选样本对应于各特征类别的各预测结果,确定所述候选样本的样本类别;根据所述候选样本的样 ...
【技术保护点】
【技术特征摘要】
1.一种样本标注方法,包括:基于各特征类别,针对候选样本执行预测,获得所述候选样本对应于各特征类别的各预测结果;根据所述候选样本对应于各特征类别的各预测结果,确定所述候选样本的样本类别;根据所述候选样本的样本类别,获取满足标注需求的未标注样本以进行样本标注。2.根据权利要求1所述的样本标注方法,其中,所述候选样本包括多个,且所述基于各特征类别,针对候选样本执行预测,获得所述候选样本对应于各特征类别的各预测结果,包括:根据候选样本的数量、每一个候选样本的样本特征的特征维度,生成样本特征矩阵;根据所述样本特征矩阵,获得类别分布公式;利用所述类别分布公式,以基于各特征类别,针对每一个候选样本执行预测,获得每一个候选样本对应于各特征类别的各预测结果。3.根据权利要求2所述的样本标注方法,其中,所述类别分布公式表示为:其中,所述x表示所述样本特征矩阵,所述k表示所述候选样本的数量,所述∑为所述样本特征矩阵的协方差矩阵,所述μ为所述样本特征矩阵中的每一列的平均值。4.根据权利要求2所述的样本标注方法,其中,所述方法还包括:利用训练好的变分自编码器针对每一个候选样本执行预测,以获得每一个候选样本的样本特征。5.根据权利要求2或3所述的样本标注方法,其中,所述特征类别包括第一特征类别和第二特征类别;且其中,所述利用所述类别分布公式,以基于各特征类别,针对每一个候选样本执行预测,获得每一个候选样本对应于各特征类别的各预测结果,包括:利用所述类别分布公式,基于所述第一特征类别、每一个候选样本的样本特征,针对每一个候选样本执行类别分布预测,获得每一个候选样本对应于所述第一特征类别的第一类别分布值;利用所述类别分布公式,基于所述第二特征类别、每一个候选样本的样本特征,针对每一个候选样本执行类别分布预测,获得每一个候选样本对应于所述第二特征类别的第二类别分布值。6.根据权利要求5所述的样本标注方法,其中,所述候选样本包括图像样本,所述第一特征类别为所述候选样本包含有指定对象,所述第二特征类别为所述候选样本不包含所述指定对象。7.根据权利要求5所述的样本标注方法,其中,所述样本类别包括第一样本类别,所述候选样本包括已标注样本;且其中,所述根据所述候选样本对应于各特征...
【专利技术属性】
技术研发人员:张庆伍,
申请(专利权)人:上海云从企业发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。