半导体测试数据的处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37989399 阅读:12 留言:0更新日期:2023-06-30 10:03
本申请提供了半导体测试数据的处理方法、装置、电子设备及存储介质,包括:基于用户的查询需求在半导体测试数据库中筛选出查询需求相对应的多个测试数据;基于每个测试数据对应的字段维度,对多个测试数据进行聚合处理,确定出每个测试数据的字段维度相对应的测试数据数组;对多个测试数据数组中的测试数据进行异常测试数据剔除后进行分层抽样处理,确定出多个测试数据中的多个抽样测试数据,测试数据以散点图的形式进行展示,并将抽样测试数据在散点图中的坐标信息进行存储。通过聚合处理、剔除异常测试数据以及分层抽样的方法,在保持样本和原始数据不存在显著性差异的前提下,分层次多步骤降低半导体数据散点图分析场景下应用的负载压力。应用的负载压力。应用的负载压力。

【技术实现步骤摘要】
半导体测试数据的处理方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理
,尤其是涉及半导体测试数据的处理方法、装置、电子设备及存储介质。

技术介绍

[0002]散点图是数据分析过程中使用频率最高的几种基础图表类型之一,由于可以真实反映原始测试数据的分布状况,是最常见的大数据量分析场景。简单的二维散点图是在笛卡尔坐标系内使用两组数据构成大量坐标点,通过对坐标点的分析判断两组变量之间是否存在关联关系,又或者分析数据所遵循的统计学分布情况。从半导体测试数据量的角度来说,一片8英寸的晶圆在维度单个测试项可能产生8万个以上的坐标点,而一个批次的晶圆可能有几十片,再经过多达几千道的测试程序后,产生的数据量数以亿行计,这已经超出了绝大数通用数据分析系统(BI系统)散点图的绘制能力,从实用性的角度而言,在不做处理的情况下,这样的数据量也超过了目前常用显示设备的分辨率,因此,不经处理的将全量数据向用户展示是没有意义的。
[0003]现阶段,在实际的芯片验证过程中,测试工程师常常需要应用各种图表来分析和表征晶圆的性能质量,而即使是单个批次的样本在测试的各个阶段累计产生的数据也经常在千万甚至亿行以上,这样的数据量必定会给BI系统带来极大的负载压力。所以,如何降低系统的负载压力提高了整体系统的可靠性成为了不容小觑的技术问题。

技术实现思路

[0004]有鉴于此,本申请的目的在于提供半导体测试数据的处理方法、装置、电子设备及存储介质,通过聚合处理、剔除异常测试数据以及分层抽样的方法,在保持样本和原始数据不存在显著性差异的前提下,分层次多步骤降低半导体数据散点图分析场景下应用的负载压力,满足该场景对于整体数据分布以及边界值的关注,提高了整体系统的可靠性。
[0005]本申请实施例提供了一种半导体测试数据的处理方法,所述处理方法包括:基于用户的查询需求在半导体测试数据库中筛选出所述查询需求相对应的多个测试数据;基于每个所述测试数据对应的字段维度,对多个所述测试数据进行聚合处理,确定出每个所述测试数据的字段维度相对应的测试数据数组;对多个所述测试数据数组中的测试数据进行异常测试数据剔除后进行分层抽样处理,确定出多个所述测试数据中的多个抽样测试数据,对多个所述测试数据以散点图的形式进行展示,并将所述抽样测试数据在所述散点图中的坐标信息进行存储。
[0006]在一种可能的实施方式中,所述对多个所述测试数据数组中的测试数据进行异常测试数据剔除后进行分层抽样处理,确定出多个所述测试数据中的多个抽样测试数据,包括:将多个所述测试数据转换为笛卡尔坐标系下的测试数据,并在所述笛卡尔坐标系
上划分多个网格状分组;对多个所述网格状分组中的异常测试数据进行剔除,从剔除所述异常测试数据的每个所述网格状分组中抽取出目标数量的测试数据,将目标数量的测试数据作为多个所述测试数据中的多个抽样测试数据。
[0007]在一种可能的实施方式中,通过以下步骤确定出所述异常测试数据:将多个所述测试数据进行排序,将在排序后的多个所述测试数据中的多个目标中位数相对应的测试数据确定为异常测试数据;基于多个所述目标中位数确定出第一位数间距与第二位数间距,基于所述第一位数间距、所述第二位数间距以及所述目标中位数确定出第一边界值和第二边界值;其中,所述第一边界值大于所述第二边界值;当所述测试数据大于所述第一边界值或者小于所述第二边界值时,则该测试数据为异常测试数据。
[0008]在一种可能的实施方式中,通过以下步骤确定出所述异常测试数据:基于多个所述测试数据相对应的目标测试项目的质量管控指标,对多个所述测试数据进行筛选确定出所述异常测试数据;或者,基于函数拟合不规则曲线对所述笛卡尔坐标系上的散点坐标从多个数据维度进行筛选,确定出异常测试数据。
[0009]在一种可能的实施方式中,通过以下步骤确定出所述目标数量的测试数据:获取预设抽样比例;基于所述预设抽样比例与所述网格状分组的数量的乘积,确定出第一数值;确定剔除所述异常测试数据之后的所述测试数据的总数目,将所述测试数据的总数目除以所述第一数值,确定出所述目标数量的测试数据。
[0010]在一种可能的实施方式中,在所述对多个所述网格状分组中的异常测试数据进行剔除,从剔除所述异常测试数据的每个所述网格状分组中抽取出目标数量的测试数据,将目标数量的测试数据作为多个所述测试数据中的多个抽样测试数据之后,所述处理方法还包括:基于所述网格状分组的数量与所述目标数量的测试数据的乘积,确定出抽样后的多个所述抽样测试数据的总数目。
[0011]在一种可能的实施方式中,在所述基于用户的查询需求在半导体测试数据库中筛选出所述查询需求相对应的多个测试数据之前,所述处理方法还包括:将多个半导体测试数据以列式存储结构的方式存储在数据库中生成所述半导体测试数据库,以便基于用户的查询需求在所述半导体测试数据库中筛选出所述查询需求相对应的多个测试数据。本申请实施例还提供了一种半导体测试数据的处理装置,所述处理装置包括:筛选模块,用于基于用户的查询需求在半导体测试数据库中筛选出所述查询需求相对应的多个测试数据;聚合模块,用于基于每个所述测试数据对应的字段维度,对多个所述测试数据进行聚合处理,确定出每个所述测试数据的字段维度相对应的测试数据数组;分层抽样模块,用于对多个所述测试数据数组中的测试数据进行异常测试数据剔
除后进行分层抽样处理,确定出多个所述测试数据中的多个抽样测试数据,对多个所述测试数据以散点图的形式进行展示,并将所述抽样测试数据在所述散点图中的坐标信息进行存储。
[0012]本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的半导体测试数据的处理方法的步骤。
[0013]本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的半导体测试数据的处理方法的步骤。
[0014]本申请实施例提供的半导体测试数据的处理方法、装置、电子设备及存储介质置,所述处理方法包括:基于用户的查询需求在半导体测试数据库中筛选出所述查询需求相对应的多个测试数据;基于每个所述测试数据对应的字段维度,对多个所述测试数据进行聚合处理,确定出每个所述测试数据的字段维度相对应的测试数据数组;对多个所述测试数据数组中的测试数据进行异常测试数据剔除后进行分层抽样处理,确定出多个所述测试数据中的多个抽样测试数据,对多个所述测试数据以散点图的形式进行展示,并将所述抽样测试数据在所述散点图中的坐标信息进行存储。通过聚合处理、剔除异常测试数据以及分层抽样的方法,在保持样本和原始数据不存在显著性差异的前提下,分层次多步骤降低半导体数据散点图分析场景下应用的负载压力,满足该场景对于整体数据分布以及边界值的关注,提高了整体系统的可靠性。
[0015]为使本申请的上述目的、特征和优点能更明显易懂,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种半导体测试数据的处理方法,其特征在于,所述处理方法包括:基于用户的查询需求在半导体测试数据库中筛选出所述查询需求相对应的多个测试数据;基于每个所述测试数据对应的字段维度,对多个所述测试数据进行聚合处理,确定出每个所述测试数据的字段维度相对应的测试数据数组;对多个所述测试数据数组中的测试数据进行异常测试数据剔除后进行分层抽样处理,确定出多个所述测试数据中的多个抽样测试数据,对多个所述测试数据以散点图的形式进行展示,并将所述抽样测试数据在所述散点图中的坐标信息进行存储。2.根据权利要求1所述的处理方法,其特征在于,所述对多个所述测试数据数组中的测试数据进行异常测试数据剔除后进行分层抽样处理,确定出多个所述测试数据中的多个抽样测试数据,包括:将多个所述测试数据转换为笛卡尔坐标系下的测试数据,并在所述笛卡尔坐标系上划分多个网格状分组;对多个所述网格状分组中的异常测试数据进行剔除,从剔除所述异常测试数据的每个所述网格状分组中抽取出目标数量的测试数据,将目标数量的测试数据作为多个所述测试数据中的多个抽样测试数据。3.根据权利要求2所述的处理方法,其特征在于,通过以下步骤确定出所述异常测试数据:将多个所述测试数据进行排序,将在排序后的多个所述测试数据中的多个目标中位数相对应的测试数据确定为异常测试数据;基于多个所述目标中位数确定出第一位数间距与第二位数间距,基于所述第一位数间距、所述第二位数间距以及所述目标中位数确定出第一边界值和第二边界值;其中,所述第一边界值大于所述第二边界值;当所述测试数据大于所述第一边界值或者小于所述第二边界值时,则该测试数据为异常测试数据。4.根据权利要求2所述的处理方法,其特征在于,通过以下步骤确定出所述异常测试数据:基于多个所述测试数据相对应的目标测试项目的质量管控指标,对多个所述测试数据进行筛选确定出所述异常测试数据;或者,基于函数拟合不规则曲线对所述笛卡尔坐标系上的散点坐标从多个数据维度进行筛选,确定出异常测试数据。5.根据权利要求2所述的处理方法,其特征在于,通过以下步骤确定出所述目标数量的测试数据:获取预设抽样比例;基于所述预设抽样比例与所述网格状分组的...

【专利技术属性】
技术研发人员:印春凯钱大君马力斯周浩
申请(专利权)人:上海孤波科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1