一种基于关键词的测试数据处理方法技术

技术编号:28459245 阅读:14 留言:0更新日期:2021-05-15 21:23
本发明专利技术提供了一种基于关键词的测试数据处理方法,包括:获取待处理的文本文件;根据预定义的关键词表,将文本文件编译成二进制文件,实现测试数据处理;所述文本文件中包括若干字段;所述关键词表中定义有:所述若干字段及其对应的关键词,关键词是预设的二进制数值。较好的,所述关键词表中还定义有:若干分隔符及其对应的关键词;能够将批量文本文件编译成一个二进制文件。实现无损压缩,方便测试数据的存储和传输,提高了实时性,能在数据处理过程中对测试数据进行初步的失效分析,方便对测试数据进行实时查看,有利于后续对测试数据的分析。的分析。的分析。

【技术实现步骤摘要】
一种基于关键词的测试数据处理方法


[0001]本专利技术属于集成电路测试领域,具体涉及一种基于关键词的数据处理方法。

技术介绍

[0002]随着集成电路的设计规模不断扩大,单一芯片上的电子器件密度越来越大,而电子器件的特征尺寸越来越小。同时,集成电路工艺流程包含着很多复杂的工艺步骤,每一步都存在特定的工艺制造偏差,导致了集成电路芯片的成品率降低。在可制造性设计的背景下,为了提高集成电路产品的成品率,缩短成品率成熟周期,业界普遍采用基于特殊设计的测试芯片的测试方法,通过对测试芯片的测试来获取制造工艺和设计成品率改善所必需的数据。
[0003]但是随着芯片的集成度越来越高,在制造过程中产生的测试数据,也在飞速增长。以高密度测试芯片为例,约包含100万个器件,目前可在25秒内完成测试,即每秒可测40000个器件;如果连续测试24小时,将能完成约35亿个器件的测试,获得的原始测试数据可达9GB,导致占用大量存储空间以及数据传输时间很长等问题。数据压缩可分成两种类型,一种叫做无损压缩,另一种叫做有损压缩。无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。目前常用的无损压缩算法有霍夫曼(Huffman)算法和LZW压缩算法。
[0004]霍夫曼编码的基本方法是先对图像数据扫描一遍,计算出各种像素出现的概率,按概率的大小指定不同长度的唯一码字,由此得到一张该图像的霍夫曼码表。编码后的图像数据记录的是每个像素的码字,而码字与实际像素值的对应关系记录在码表中。
[0005]LZW压缩算法有三个重要的对象:数据流(CharStream)、编码流(CodeStream)和编译表(String Table)。在编码时,数据流是输入对象(文本文件的据序列),编码流就是输出对象(经过压缩运算的编码数据);在解码时,编码流则是输入对象,数据流是输出对象;而编译表是在编码和解码时都须要用借助的对象。
[0006]根据目前的无损压缩算法的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的1/2~1/3。针对集成电路中产生的海量测试数据,目前尚未有极具针对性的更高压缩率的数据处理方法,且现有的无损压缩算法也无法对测试数据做异常检测等预处理,急需一种针对测试机在芯片测试过程中产生的大量测试数据,在传输、存储以及数据失效分析前的处理方法。

技术实现思路

[0007]本专利技术是基于上述现有技术的问题而进行的,目的在于提供一种基于关键词的测试数据处理方法,用于对集成电路中产生的以文本文件存储的测试数据进行处理。
[0008]本专利技术提供的一种基于关键词的测试数据处理方法,用于对以文本文件存储的测试数据进行处理,所述基于关键词的测试数据处理方法包括:步骤一:获取待处理的文本文
件和预定义的关键词表;步骤二:根据关键词表,将文本文件编译成二进制文件,实现数据处理;所述文本文件中包括若干字段;所述关键词表中定义有:所述若干字段及其对应的关键词,关键词是预设的二进制数值。
[0009]具体的,所述若干字段包括:表示芯片信息的字段、表示测试条件的字段和表示测试数据的字段;所述关键词表中定义的若干字段包括:表示芯片信息的字段、表示测试条件的字段和表示测试数据的字段。
[0010]作为进一步的改进,在对文本文件中的字段进行编译时,将该字段的长度、该字段对应的关键词和以二进制表示的该字段的数据信息都写入二进制文件中;该字段的长度是指该字段对应的关键词的字节数和以二进制表示的该字段数据信息的字节数之和。
[0011]在一个具体的实施情况里,所述关键词表中还定义有:若干数据类型及其对应的关键词;对文本文件中的字段进行编译时,将该字段的长度、该字段对应的关键词、该字段数据类型对应的关键词和以二进制表示的该字段的数据信息都写入二进制文件中;该字段的长度是指该字段对应的关键词的字节数、该字段数据类型对应的关键词的字节数和以二进制表示的该字段数据信息的字节数之和。
[0012]其中较好的,所述关键词表中定义的数据类型包括:String、Int、Float和No Data;其中,No Data表示数据缺失,且仅用于结束符。
[0013]在一个可行的实施方案中,所述关键词表中还定义有:若干分隔符及其对应的关键词;对文本文件进行编译时,当文本文件中出现关键词表中的分隔符时,将该分隔符对应的关键词写入二进制文件中。
[0014]其中可选的,所述关键词表中定义的分隔符包括:开始(Begin)、换行(EndLine)、文件结束(EndFile)和终止(End)。
[0015]在另一个可行的实施方案中,所述若干字段还包括表示测试是否出现异常的字段:bad;bad字段的数据类型为String;所述关键词表中还定义有bad字段及其对应的关键词。
[0016]在一个有利的实施例中,所述获取待处理的文本文件有若干个,是批量文本文件;根据关键词表,将所述批量文本文件编译成一个二进制文件,实现数据处理。
[0017]其中将所述批量文本文件编译成一个二进制文件,实现数据处理的过程包括:步骤S1.获取若干个待处理的文本文件,取出一个待处理的文本文件;步骤S2.先在二进制文件中写入表示开始(Begin)分隔符的关键词,以及以二进制表示的被取出的所述待处理文本文件的文件名;然后根据关键词表,依次在二进制文件中编译写入被取出的所述待处理文本文件的所有信息;且根据关键词表,将文本文件中的换行(EndLine)分隔符编译成表示换行(EndLine)分隔符的关键词写入二进制文件中;完成对这个被取出的文本文件的编译后,在二进制文件中写入表示文件结束(EndFile)分隔符的关键词;步骤S3.判断是否还有待处理的文本文件,若有,则取出一个待处理的文本文件至步骤S2;若无,则在二进制文件中写入表示终止(End)分隔符的关键词,完成对所有文本文件的数据处理。
[0018]其中优选的,所述若干字段中,表示芯片信息的字段包括:lot字段、wafer字段、die字段和array字段,用于表示所测的器件信息;表示测试条件(test condition)的字段包括:测试电压、测试电流;表示测试数据(test data)的字段为测试得到的电性参数值;其中,所述lot字段表示wafer所属的lot编号;所述wafer字段表示wafer编号;所述die字段包
括x坐标和y坐标,表示die字段在wafer中的位置;所述array字段表示array编号;所述lot字段、wafer字段、array字段和表示测试条件(test condition)的字段,数据类型都是String;所述die字段的数据类型为Int;所述表示测试数据(test data)的字段,数据类型为Float。
[0019]在另一个有利的实施例中,对所述若干字段预设有数据标准,在对一个特定字段进行编译时,判断该特定字段的数据是否符合数据标准:若符合数据标准,则将以二进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于关键词的测试数据处理方法,用于对以文本文件存储的测试数据进行处理,其特征在于,所述基于关键词的测试数据处理方法包括:步骤一:获取待处理的文本文件和预定义的关键词表;步骤二:根据关键词表,将文本文件编译成二进制文件,实现测试数据处理;所述文本文件中包括若干字段;所述关键词表中定义有:所述若干字段及其对应的关键词,关键词是预设的二进制数值。2.根据权利要求1所述的一种基于关键词的测试数据处理方法,其特征在于,所述若干字段包括:表示芯片信息的字段、表示测试条件的字段和表示测试数据的字段;所述关键词表中定义的若干字段包括:表示芯片信息的字段、表示测试条件的字段和表示测试数据的字段。3.根据权利要求1所述的一种基于关键词的测试数据处理方法,其特征在于,在对文本文件中的字段进行编译时,将该字段的长度、该字段对应的关键词和以二进制表示的该字段的数据信息都写入二进制文件中;该字段的长度是指该字段对应的关键词的字节数和以二进制表示的该字段数据信息的字节数之和。4.根据权利要求1所述的一种基于关键词的测试数据处理方法,其特征在于,所述关键词表中还定义有:若干数据类型及其对应的关键词;对文本文件中的字段进行编译时,将该字段的长度、该字段对应的关键词、该字段数据类型对应的关键词和以二进制表示的该字段的数据信息都写入二进制文件中;该字段的长度是指该字段对应的关键词的字节数、该字段数据类型对应的关键词的字节数和以二进制表示的该字段数据信息的字节数之和。5.根据权利要求1所述的一种基于关键词的测试数据处理方法,其特征在于,所述关键词表中还定义有:若干分隔符及其对应的关键词;对文本文件进行编译时,当文本文件中出现关键词表中的分隔符时,将该分隔符对应的关键词写入二进制文件中。6.根据权利要求1所述的一种基于关键词的测试数据处理方法,其特征在于,所述待处理的文本为批量文本文件;根据关键词表,将所述批量文本文件编译成一个二进制文件,实现数据处理。7.根据权利要求6所述的一种基于关键词的测试数据处理方法,其特征在于,将所述批量文本文件编译成一个二进制文件,实现数据处理的过程包括:步骤S1.获取若干个待处理的文本文件,取出...

【专利技术属性】
技术研发人员:彭焱陈小川
申请(专利权)人:杭州广立微电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1