一种基于特征相似度的自适应聚类方法及应用技术

技术编号:24939622 阅读:27 留言:0更新日期:2020-07-17 21:17
本发明专利技术公开了一种基于特征相似度的自适应聚类方法,包括如下步骤:S01:设置初始深度学习参数,提取样品特征;S02:设置初始聚类数k以及步长x,以此确定m个聚类数;S03:对样品特征进行聚类;S04:针对每一组聚类结果,计算其对应的聚类效果函数值f(p);S05:根据最大聚类数对应的聚类效果函数值梯度,确定新的聚类数k’;S06:重复步骤S03‑S05,直至最大聚类数对应的聚类效果函数值梯度小于梯度阈值,记录当前聚类效果函数值f(k’);S07:调整深度学习参数,重复步骤S02‑S06n次,选择使当前聚类效果函数值f(k’)最大的深度学习参数和聚类数;并得出其对应的聚类结果。本发明专利技术能够更精细准确的对样品特征进行聚类,有利于发现更多导致白色像素的原因。

【技术实现步骤摘要】
一种基于特征相似度的自适应聚类方法及应用
本专利技术涉及聚类方法,具体涉及一种基于特征相似度的自适应聚类方法及应用。
技术介绍
白色像素分布是衡量CIS(CMOS图像传感器)的关键指标之一,CMOS图像传感器中白色像素分布情况直接关系到其产生的图像质量,尤其是在低光或高温下产生图像的均匀性。产生白色像素的根本原因是CMOS图像传感器所在硅片表面具有缺陷或硅片表面被金属玷污,缺陷和金属玷污物可能来源于物料、机台和工艺等;其中,不同工艺原因会造成CMOS图像传感器中白色像素特定的分布模式,而且造成白色像素的工艺原因和白色像素的分布模式之间具有比较明确的一一对应关系。因此,根据CMOS图像传感器输出图像的测试数据可以寻找出白色像素分布模式,进而快速准确地分析造成白色像素分布模式的原因,从而找到产生白色像素分布模式的工艺问题,并反馈给工艺制造。通过对测试数据的分析,可以尽快调整对应的工艺步骤,这对于CIS的质量和制造效率提升有着积极的推动作用。现有技术中针对CIS中白色像素分布的分析,还没有高速有效的智能分析方法。现有技术中针对CIS输出的图像通常进行人工分析,以经验值或者肉眼观察的方式确定白色像素,并采用肉眼观察的方式总结出白色像素分布情况,再根据制造经验确定造成白色像素分布的原因。现有技术中的分析方法效率低,只能对CMOS图像传感器的测试数据进行简单扼要的分析,无法对白色像素进行有效分类,进而无法准确确定白色像素的分布模式。随着人工智能的发展,聚类方法逐渐应用在白色像素分布领域;在对白色像素分布模式进行分类时,往往无法准确确定白色像素的聚类数,而聚类数的确定又决定着分类结果的准确性。若无法对白色像素进行准确分类,则不能准确找出白色像素分布与工艺制造之间的对应关系。
技术实现思路
本专利技术的目的是提供一种基于特征相似度的自适应聚类方法及应用,能够更精细准确的对样品特征进行聚类,有利于发现更多导致白色像素分布的原因,进而提高白色像素分析效率。为了实现上述目的,本专利技术采用如下技术方案:一种基于特征相似度的自适应聚类方法,包括如下步骤:S01:设置初始深度学习参数,提取样品特征;S02:设置初始聚类数k以及步长x,以此确定m个聚类数;k、x、m均为大于0的整数;S03:针对每一个聚类数,对所述样品特征进行聚类,从而得出m组聚类结果;S04:针对每一组聚类结果,计算其对应的聚类效果函数值f(p),从而得出m个聚类效果函数值;p表示聚类数;S05:根据最大聚类数对应的聚类效果函数值梯度;确定新的聚类数k’;S06:重复步骤S03-S05,直至最大聚类数对应的聚类效果函数值梯度小于梯度阈值,记录当前聚类效果函数值f(k’);S07:调整深度学习参数,重复步骤S02-S06n次,选择使当前聚类效果函数值f(k’)最大的深度学习参数和聚类数;并得出其对应的聚类结果。进一步地,所述步骤S01中深度学习参数包括网络深度、训练批次、批处理大小和特征个数。进一步地,所述步骤S01中利用变分自编码器提取样品特征。进一步地,所述步骤S03中设置步长为10,以此确定的5个聚类数分别为:k,k+10,k+20,k+30,k+40。进一步地,所述步骤S03中采用K均值聚类算法对所述样品特征进行聚类。进一步地,所述步骤S04中聚类效果函数值其中,dpri为第p个聚类数,第r类中,第i个样品点的相似度;thres为相似度阈值;Np为第p个聚类数中的总样本数。进一步地,所述第p个聚类数,第r类中,第i个样品点的相似度基于该样本点的特征与该类簇中心的欧式距离得出。进一步地,所述第p个聚类数,第r类中,第i个样品点的相似度其中,bpri为第p个聚类数,第r类,第i个样品点的特征;cpr为第p个聚类数,第r类的簇中心。进一步地,所述步骤S05中根据最大聚类数对应的聚类效果函数值梯度确定新的聚类数k’和k’-x。进一步地,所述步骤S05中新的聚类数k’=k+step,step=(1×sign(g(p)+m×g(p))3;其中,k为初始聚类数,sign为符号函数,g(p)为最大聚类数对应的聚类效果函数值梯度。一种采用基于特征相似度的自适应聚类进行白色像素分析的方法,包括如下步骤:T01:根据白色像素阈值将CMOS图像传感器的测试数据转换为二值图,每个二值图对应为一个样品;T02:对样品作图片预处理,筛选出有白色像素分布的样品;T03:采用权利要求1中的自适应聚类方法对筛选出的样品进行聚类,得出聚类结果;T04:根据聚类结果对样品贴标签;T05:采用有监督学习方法对含有标签的样品进行分类,并结合CMOS图像传感器的制作工艺,分析CMOS图像传感器中白色像素分布的原因。本专利技术具有如下有益效果:本专利技术提供的自适应聚类方法,通过多次重复逼近,找出最优的聚类模型,能够更精细准确的对样品特征进行聚类;本专利技术聚类方法应用于白色像素分析时,能够确保对白色像素分布特征进行精细准确分类,有利于发现更多导致白色像素分布的原因,进而提高白色像素分析效率。附图说明附图1为本专利技术基于特征相似度的自适应聚类方法的流程图;附图2为本专利技术自适应聚类方法应用在白色像素分布时的流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术的具体实施方式做进一步的详细说明。如附图1所示,本专利技术提供的一种基于特征相似度的自适应聚类方法,包括如下步骤:S01:设置初始深度学习参数,提取样品特征。具体的,深度学习参数包括网络深度h、训练批次epoch、批处理大小batch_size和特征个数n。优选的,本专利技术可以利用变分自编码器提取样品特征。当本专利技术中聚类方法应用于白色像素分析时,CMOS图像传感器经过测试机台得到CMOS图像传感器测试数据,设定白色像素阈值,将测试数据转换为二值图,每个二值图对应一个样品,通过变分自编码器提取上述样品,也就是二值图中的白色像素特征。S02:设置初始聚类数k以及步长x,以此确定m个聚类数;k、x、m均为大于0的整数。优选的,本专利技术中可以设置步长为10,以此确定的5个聚类数分别为:k,k+10,k+20,k+30,k+40。这里设置的初始聚类数以及初始深度学习参数不一定是最优的聚类数,通过下述的自适应逼近方法,才能选出最优的聚类数和深度学习参数。S03:针对每一个聚类数,对样品特征进行聚类,从而得出m组聚类结果。优选的,本专利技术可以采用K均值聚类算法对样品特征进行聚类,具体的聚类方法如现有技术所述,在此不再详细介绍。S04:针对每一组聚类结果,计算其对应的聚类效果函数值f(p),从而得出m个聚类效果函数值;p表示聚类数。具体的,聚类效果函数值的计算方法如下:其中,dpri为第p个聚类数,第r类中,第i个样品点的相似度,用于衡量该样品属于该类的可能性;本文档来自技高网
...

【技术保护点】
1.一种基于特征相似度的自适应聚类方法,其特征在于,包括如下步骤:/nS01:设置初始深度学习参数,提取样品特征;/nS02:设置初始聚类数k以及步长x,以此确定m个聚类数;k、x、m均为大于0的整数;/nS03:针对每一个聚类数,对所述样品特征进行聚类,从而得出m组聚类结果;/nS04:针对每一组聚类结果,计算其对应的聚类效果函数值f(p),从而得出m个聚类效果函数值;p表示聚类数;/nS05:根据最大聚类数对应的聚类效果函数值梯度,确定新的聚类数k’;/nS06:重复步骤S03-S05,直至最大聚类数对应的聚类效果函数值梯度小于梯度阈值,记录当前聚类效果函数值f(k’);/nS07:调整深度学习参数,重复步骤S02-S06n次,选择使当前聚类效果函数值f(k’)最大的深度学习参数和聚类数;并得出其对应的聚类结果。/n

【技术特征摘要】
1.一种基于特征相似度的自适应聚类方法,其特征在于,包括如下步骤:
S01:设置初始深度学习参数,提取样品特征;
S02:设置初始聚类数k以及步长x,以此确定m个聚类数;k、x、m均为大于0的整数;
S03:针对每一个聚类数,对所述样品特征进行聚类,从而得出m组聚类结果;
S04:针对每一组聚类结果,计算其对应的聚类效果函数值f(p),从而得出m个聚类效果函数值;p表示聚类数;
S05:根据最大聚类数对应的聚类效果函数值梯度,确定新的聚类数k’;
S06:重复步骤S03-S05,直至最大聚类数对应的聚类效果函数值梯度小于梯度阈值,记录当前聚类效果函数值f(k’);
S07:调整深度学习参数,重复步骤S02-S06n次,选择使当前聚类效果函数值f(k’)最大的深度学习参数和聚类数;并得出其对应的聚类结果。


2.根据权利要求1所述的一种基于特征相似度的自适应聚类方法,其特征在于,所述步骤S01中深度学习参数包括网络深度、训练批次、批处理大小和特征个数。


3.根据权利要求1所述的一种基于特征相似度的自适应聚类方法,其特征在于,所述步骤S01中利用变分自编码器提取样品特征。


4.根据权利要求1所述的一种基于特征相似度的自适应聚类方法,其特征在于,所述步骤S03中采用K均值聚类算法对所述样品特征进行聚类。


5.根据权利要求1所述的一种基于特征相似度的自适应聚类方法,其特征在于,所述步骤S04中聚类效果函数值其中,dpri为第p个聚类数,第r类中,第i个样品点的相似度;thres为相似度阈值;Np为第p个聚类数中...

【专利技术属性】
技术研发人员:孙红霞李琛余学儒傅豪田畔
申请(专利权)人:上海集成电路研发中心有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1