System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于计算机数据处理领域,尤其涉及一种半导体材料荧光光谱数据的高通量精确拟合处理方法。
技术介绍
1、荧光光谱是半导体材料中是一种探测材料电子结构的非接触式、非破坏性方法。相比于x射线衍射(xrd),紫外光电子能谱(ups)等其他微观表征手段,荧光光谱不仅可以较为精确的反映出半导体材料中较为精确的成分、结构以及缺陷态等信息,其还具有表征手段简单快速、表征设备便宜等优势,因此在半导体加工产业中也常被用于产品质量的检测。
2、然而,随着自动化设备的高速发展,以及半导体行业对于巨量材料筛选的需求,半导体材料的制备和表征已经开始向自动化、高通量化转变,面对巨量样品所产生的巨量荧光光谱数据,传统人工分析荧光光谱方法已经难以满足高通量自动化实验和生产的需求。
3、目前,依赖于人工智能的快速发展,对于巨量荧光光谱的分析可以通过机器学习或是非负矩阵分解实现,不过这些方法都没有对荧光光谱谱线进行拟合处理,因此对于研究人员而言更为重要的荧光峰的信息并没有被有效的抽取出来,即虽然通过高通量的实验和表征设备可以得到大量的荧光光谱数据,但是这些数据中蕴含的材料信息并没有被完全的利用,这不利于研究人员对于高通量实验数据的分析。
4、因此对于半导体材料的高通量研究和生产而言,亟需一种可以准确的拟合荧光光谱的自动化方法。
技术实现思路
1、针对
技术介绍
所存在的问题,本专利技术的目的在于提供一种高通量自动化荧光光谱的拟合分峰方法,以对半导体材料高通量实验和生产中所产生巨量
2、本专利技术采用的技术方案为:
3、一种高通量自动化荧光光谱的拟合分峰方法,该方法包括:
4、接收高通量实验设备端产生的荧光光谱序列数据并整理为数据集合,得到不同半导体样品的荧光光谱数据;
5、对每一半导体样品的荧光光谱数据进行若干次分区处理,每次分区处理时分区数量不同,得到每一次分区处理后的一组分区数据,并对各组的各分区数据进行初始化,得到多组初始化参数集;
6、遍历每一组初始化参数集,以一组初始化参数集进行一次高斯(gauss)拟合,并记录拟合后的高斯参数集,得到多组高斯参数集;并基于拟合效果从多组高斯参数集中确定最佳拟合参数集;
7、对各半导体样品所对应的最佳拟合参数集进行可视化显示,以输出带有荧光峰参数的可视化数据图像。
8、优选的,数据集合以表项的形式存储,首列为荧光的波长坐标,从第二列开始的每一列为不同半导体样品的在首列波长坐标下的荧光光谱数据。
9、优选的,各分区数据进行初始化时,初始化参数包括每个数据分区的数据中心点和荧光强度的加权标准差,数据中心点的表征信息包括波长和荧光强度;
10、优选的,对每一半导体样品的荧光光谱数据进行分区处理并对各分区数据进行初始化具体为:
11、定义n表示每一次分区处理时的分区数量,将每一半导体样品的荧光光谱数据按照波长坐标划分为n个等间距的数据分区,并确定每个数据分区的初始的数据中心点;
12、计算每一半导体样品的荧光光谱数据的各数据点分别与各数据中心点之间的欧式距离,并将其归类于与其欧式距离最近的数据中心点所在的数据分区,通过加权平均值重新计算该数据分区的数据中心点坐标:
13、
14、其中,μ′k表示更新后的数据中心点坐标,ck表示第k个数据分区,xi、yi分别表示属于ck的第i个数据点的波长和荧光强度;
15、重复进行数据点归类和数据中心点坐标更新,直到得到的数据中心点坐标收敛,得到更新后的n个数据分区;
16、再基于每个数据分区的数据中心点和每个数据分区的荧光强度的加权标准差更新每个分区数据的初始化参数:
17、
18、
19、其中,a′k表示更新后的数据中心点的荧光强度,σ′k表示更新后的数据中心点的荧光强度的加权标准差;
20、基于当前的μ′k、a′k和σ′k得到第k个数据分区的初始化参数。
21、优选的,提取每一半导体样品的荧光光谱数据并进行若干次分区处理时,基于数据集合中含有的荧光峰数量的上限n确定分区处理的次数,且每次分区处理时的分区数量n的取值为n∈{1,2,3,…,n}。
22、优选的,采用修正的最大期望算法(expectation-maximization algorithm,em)以一组初始化参数集进行一次gauss拟合,具体为:
23、(1)基于当前组的n个初始化参数得到初始化条件的n个gauss参数θk=(μk,ak,σk)的初始值,即μk=μk′,ak=ak′,σk=σk′,其中,k=1,2,…,n;其中,μk、ak、σk分别表示第k个高斯组分的数据中心点的波长、荧光强度,以及第k个高斯组分的荧光强度的加权标准差;
24、(2)遍历每一个波长,计算初始化条件下的标准高斯曲线后验概率zi(k):zi(k)=yi/qi;
25、其中,yi表示当前初始条件下的第k个gauss参数θk下的标准gauss曲线在波长xi处的强度,且yi=akexp(-(xi-μk)2/2σk2),xi表示荧光光谱数据的第i个波长,qi表示当前半导体样品的荧光光谱数据中处于波长xi处的荧光强度;
26、(3)基于初始条件计算拟合前的对数似然函数l1(θ),其中,高斯参数集θ={θ1,θ2,…,θn};
27、(4)对高斯参数集θ进行更新,再基于更新后的高斯参数集θ计算拟合后对数似然函数l2(θ);
28、检测l1(θ)与l2(θ)的变化值是否小于或等于指定的阈值参数,若是,则将最近一次更新后的高斯参数集θ作为高斯拟合后的高斯参数集并记录;否则,以当前的高斯参数集θ为新的初始条件继续执行步骤(2)至(4);
29、其中,高斯参数集θ的更新方式为:
30、分别更新θk中的三个参数μk、σk、ak,得到更新后的值
31、
32、
33、
34、其中,nk表示第k个高斯组分对应的所有荧光强度数据的累加和。
35、优选的,基于拟合效果从多组高斯参数集中确定最佳拟合参数集时,基于当前组高斯参数集的对数似然函数和高斯参数集的参数数目确定拟合效果参数,拟合效果参数取值越小表示拟合效果越好。
36、优选的拟合效果参数的计算公式为:aic=2*nparameters-2*flikelihood;
37、其中,flikelihood表示当前组高斯参数集所对应的对数似然函数,nparameters表示当前组高斯参数集的参数数目。
38、优选的,对各半导体样品所对应的最佳拟合参数集进行可视化显示的显示内容包括:最佳拟合参数集所对应拟合曲线及荧光峰参数,以及数据集合的原始数据所对应的荧光光谱曲线。本文档来自技高网...
【技术保护点】
1.一种高通量自动化荧光光谱的拟合分峰方法,其特征在于,包括下列步骤:
2.如权利要求1所述的方法,其特征在于,数据集合以表项的形式存储,首列为荧光的波长坐标,从第二列开始的每一列为不同半导体样品的在首列波长坐标下的荧光光谱数据。
3.如权利要求1所述的方法,其特征在于,对每一半导体样品的荧光光谱数据进行分区处理并对各分区数据进行初始化具体为:
4.如权利要求1所述的方法,其特征在于,提取每一半导体样品的荧光光谱数据并进行若干次分区处理时,基于数据集合中含有的荧光峰数量的上限N确定分区处理的次数,且每次分区处理时的分区数量n的取值为n∈{1,2,3,…,N}。
5.如权利要求1所述的方法,其特征在于,采用修正的最大期望算法以一组初始化参数集进行一次高斯拟合,具体为:
6.如权利要求1至5任一项所述的方法,其特征在于,基于拟合效果从多组高斯参数集中确定最佳拟合参数集时,基于当前组高斯参数集的对数似然函数和高斯参数集的参数数目确定拟合效果参数,拟合效果参数取值越小表示拟合效果越好。
7.如权利要求6所述的方法,其
8.如权利要求1所述的方法,其特征在于,对各半导体样品所对应的最佳拟合参数集进行可视化显示的显示内容包括:最佳拟合参数集所对应拟合曲线及荧光峰参数,以及数据集合的原始数据所对应的荧光光谱曲线。
9.如权利要求1所述的方法,其特征在于,显示内容还包括:对各Gauss拟合曲线,在同一坐标轴中添加荧光光谱数据所对应的数据点。
10.如权利要求1所述的方法,其特征在于,采用散点图形式对最佳拟合参数集中的各参数值按照参数类别进行显示。
...【技术特征摘要】
1.一种高通量自动化荧光光谱的拟合分峰方法,其特征在于,包括下列步骤:
2.如权利要求1所述的方法,其特征在于,数据集合以表项的形式存储,首列为荧光的波长坐标,从第二列开始的每一列为不同半导体样品的在首列波长坐标下的荧光光谱数据。
3.如权利要求1所述的方法,其特征在于,对每一半导体样品的荧光光谱数据进行分区处理并对各分区数据进行初始化具体为:
4.如权利要求1所述的方法,其特征在于,提取每一半导体样品的荧光光谱数据并进行若干次分区处理时,基于数据集合中含有的荧光峰数量的上限n确定分区处理的次数,且每次分区处理时的分区数量n的取值为n∈{1,2,3,…,n}。
5.如权利要求1所述的方法,其特征在于,采用修正的最大期望算法以一组初始化参数集进行一次高斯拟合,具体为:
6.如权利要求1至5任一项所述的方法,其特征...
【专利技术属性】
技术研发人员:刘子宜,柏奉辰,刘博文,熊杰,赵怡程,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。