样本数据处理方法、装置、设备、存储介质和程序产品制造方法及图纸

技术编号:45096181 阅读:19 留言:0更新日期:2025-04-25 18:34
本申请公开了一种样本数据处理方法、装置、设备、存储介质和程序产品,涉及计算机技术领域,本申请的方法中,标注文件包括与标注结果一一对应的结果统计区域,将各个样本标识记录在需关联的标注结果的结果统计区域中,且每个结果统计区域中的样本标识保存在存储介质的连续存储区域。这样,在筛选具有目标标注结果的样本数据时,可以在一次IO读取过程中,读取到一个标注结果关联的多个样本标识,相当于在一次IO读取过程中,可以读取到多条样本标识和标注结果之间的关联关系,这样,可以大大减少数据读取的IO次数,提高数据读取效率,进而提高样本数据的处理效率。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及样本数据处理方法、装置、设备、存储介质和程序产品


技术介绍

1、在一些人工智能平台中,支持用户导入样本数据,并对样本数据进行处理,比如修改质量较差的样本数据。同时,还支持用户创建或导入待训练的模型,并基于处理后的样本数据对模型进行训练。

2、目前,在这些人工智能平台中,为了保证样本数据的质量,需要对样本数据进行逐条检查并手动修改质量差的样本数据,样本数据的处理效率比较低。


技术实现思路

1、本申请提供了样本数据处理方法、样本数据处理装置、电子设备、非易失性计算机可读存储介质和计算机程序产品,以至少解决相关技术中样本数据的处理效率低的问题。

2、本申请提供了一种样本数据处理方法,包括:

3、响应于接收到第一展示指令,展示样本数据集中的至少部分样本数据,所述样本数据集包括多条样本数据,且所述样本数据具有样本标识;

4、响应于展示的样本数据被执行标注操作,在标注文件中记录所述样本数据的样本标识和标注结果之间的关联关系,所述标注结果表征所述样本文档来自技高网...

【技术保护点】

1.一种样本数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述样本数据集中,样本数据的样本标识被划分为多个样本标识区间,所述标注文件还包括与所述样本标识区间一一对应的区间统计区域,每个所述区间统计区域分别包括与所述标注结果一一对应的结果统计区域;

3.根据权利要求2所述的方法,其特征在于,在标注文件中记录所述样本数据的样本标识和标注结果之间的关联关系之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述判断所述样本数据是否为所述样本数据集中第一个被标注的样本数据,包括:

5.根据权利要...

【技术特征摘要】

1.一种样本数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述样本数据集中,样本数据的样本标识被划分为多个样本标识区间,所述标注文件还包括与所述样本标识区间一一对应的区间统计区域,每个所述区间统计区域分别包括与所述标注结果一一对应的结果统计区域;

3.根据权利要求2所述的方法,其特征在于,在标注文件中记录所述样本数据的样本标识和标注结果之间的关联关系之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述判断所述样本数据是否为所述样本数据集中第一个被标注的样本数据,包括:

5.根据权利要求2所述的方法,其特征在于,在标注文件中记录所述样本数据的样本标识和标注结果之间的关联关系之前,所述方法还包括:

6.根据权利要求1或2所述的方法,其特征在于,在所述标注文件中记录所述样本数据的样本标识和标注结果之间的关联关系时,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,基于如下方法判断所述样本数据集中的样本数据是否被更新:

10.根据权利要求1所述的方法,其特征在于,所述方法还包括:

11.根据权利要求10所述的...

【专利技术属性】
技术研发人员:郑玉会
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1