数据处理方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:30327062 阅读:26 留言:0更新日期:2021-10-10 00:12
本发明专利技术实施例公开了一种数据处理方法、装置、电子设备以及存储介质。该方法包括:获取待筛选的未标注数据,基于预先训练的分割模型提取所述未标注数据的数据特征和分割结果;基于所述特征数据对所述未标注数据进行不确定性判别,和/或,基于所述分割结果对所述未标注数据进行多样性判别;基于所述不确定性判别结果和/或多样性判别结果对各所述未标注数据进行筛选,确定目标数据,其中,所述目标数据用于进行数据标注后作为模型训练样本。通过本发明专利技术实施例公开的技术方案,实现了获取大量未标注的样本数据中具有代表性的样本数据,以减少标注人员的工作量,节约人工成本。节约人工成本。节约人工成本。

【技术实现步骤摘要】
数据处理方法、装置、电子设备以及存储介质


[0001]本专利技术实施例涉及人工智能
,尤其涉及一种数据处理方法、装置、电子设备以及存储介质。

技术介绍

[0002]近年随着深度学习的持续升温,各种方法与应用层出不穷。方法主要是新的模型的提出,还有就是将深度学习模型与传统方法的结合。应用主要是对现有的模型进行改进以适应不同的应用场合。其中,图像分割传统的方法有基于阈值的分割方法、基于边缘的分割方法、基于区域的分割方法等,分割效果不佳。自从深度学习用于图像分割以后,分割效果显著,远远的超过传统的图像分割方法,但是深度学习用于图像分割的缺点也是同样的显著,就是需要大量的人工分割的标注数据进行训练,这是非常耗费人工成本的。

技术实现思路

[0003]本专利技术提供一种数据处理方法、装置、电子设备以及存储介质,以实现获取大量未标注的样本数据中具有代表性的样本数据,以减少标注人员的工作量,节约人工成本。
[0004]第一方面,本专利技术实施例提供了一种数据处理方法,该方法包括:
[0005]获取待筛选的未标注数据,基于本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取待筛选的未标注数据,基于预先训练的分割模型提取所述未标注数据的数据特征和分割结果;基于所述特征数据对所述未标注数据进行不确定性判别,和/或,基于所述分割结果对所述未标注数据进行多样性判别;基于所述不确定性判别结果和/或多样性判别结果对各所述未标注数据进行筛选,确定目标数据,其中,所述目标数据用于进行数据标注后作为模型训练样本。2.根据权利要求1所述的方法,其特征在于,基于所述特征数据对所述未标注数据进行不确定性判别,包括:将所述未标注数据的数据特征输入到判别模型,得到所述判别模型输出的所述未标注数据的不确定性判别结果;相应的,基于所述不确定性判别结果对各所述未标注数据进行筛选,确定目标数据,包括:基于各所述未标注数据的不确定性判别结果和确定性条件对各未标注数据进行筛选,并将满足所述确定性条件的未标注数据确定为目标数据。3.根据权利要求1所述的方法,其特征在于,所述基于所述分割结果对所述未标注数据进行多样性判别,包括:将所述分割结果输入到质控模型,得到所述质控模型输出的所述分割结果的评价数据;相应的,基于所述多样性判别结果对各所述未标注数据进行筛选,确定目标数据,包括:基于各所述未标注数据的分割结果的评价数据和数据多样性阈值对所述各未标注数据进行筛选,并将满足所述数据多样性条件的未标注数据确定为目标数据。4.根据权利要求1所述的方法,其特征在于,所述基于所述不确定性判别结果和多样性判别结果对各所述未标注数据进行筛选,确定目标数据,包括:将同时满足确定性条件以及多样性条件的未标注数据确定为目标数据;或者,将满足确定性条件的未标注数据或者满足多样性条件的数据确定为目标数据。5.根据权利要求1所述的方法,其特征在于,所述分割模型包括编码子模型和解码子模型;所述编码子模型用于提取所述未标注数据的数据特征,并输出所述数据特征;所述解码子模型用于对所述编码子模型输出的数据特征进行解码,并输出所述未标注数据的分割结果。6.根据权利要求...

【专利技术属性】
技术研发人员:谭卫雄王少康陈宽
申请(专利权)人:推想医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1