当前位置: 首页 > 专利查询>东北大学专利>正文

一种X射线定向仪缺陷识别的批量处理方法技术

技术编号:19824033 阅读:26 留言:0更新日期:2018-12-19 15:30
本发明专利技术提出一种X射线定向仪缺陷识别的批量处理方法,属于单晶材料加工领域,提出了离线批量式单晶晶体缺陷检测方法,设计了单晶晶体回摆曲线的特征向量,以抽象出曲线特征,结合粒子群优化算法,并引入基于密度函数的有效半径,改进了传统FCM算法,提升算法对于初始化聚类中心的鲁棒性,避免陷入局部极优,并很好地过滤干扰数据,从而实现对批量数据进行聚类,之后仅需对聚类中心特征向量进行缺陷检测,根据隶属度关系即可得到所有待测曲线的缺陷类型,其中包含了本发明专利技术提出的改进的模糊传递闭包聚类算法,定义模糊相似矩阵,保证了相似计算的准确性,本发明专利技术为晶体检测技术提供了全新的思路和实现方式。

【技术实现步骤摘要】
一种X射线定向仪缺陷识别的批量处理方法
本专利技术属于单晶材料加工领域,具体涉及一种X射线定向仪缺陷识别的批量处理方法。
技术介绍
在晶体生长过程中,不可避免的问题就是晶体缺陷,因其技术固有的局限性会导致存在非理想的晶体结构。工业上,高精度、高效率的X射线衍射技术是常用的晶体缺陷无损检测手段,通过单晶晶体对X射线产生衍射,接收衍射信号得到对应特征曲线,即回摆曲线,基于回摆曲线特征即可分析待测晶体的品质特征。目前,基于上述技术用于单晶晶体缺陷检测的X射线定向仪自动化水平欠缺,质量参差不齐,呈现“一人一机一库一片”的现象。仪器需人工参与,且无法高效、准确、智能地识别单晶晶体的缺陷类型;各单晶晶体检测数据相互独立,各仪器仅为“信息孤岛”,无法相互借鉴、相互学习,不能更新、共享样本库;一次仅能进行一片单晶晶体的检测工作,无法对来自其他仪器的待识别回摆曲线数据进行识别检测,无法离线对批量回摆曲线进行快速检测。随着单晶晶体材料的发展,应用面越来越广,对于单晶晶体材料品质的高效快速的检测技术需求日益迫切。针对上述问题,本专利技术提出了一种X射线定向仪缺陷识别的批量处理方法,根据已经测量得到的大量单晶材料回摆曲线,以批量的形式进行缺陷类型识别,实现了单晶材料的快速自动缺陷识别,为X射线定向仪的应用提供了新的功能。模糊划分的概念最早由著名学者Ruspini提出,随后由Kim等学者提出基于模糊等价关系的模糊聚类方法。该方法的基本思想为:由于模糊等价矩阵R*是论域集U与自己的直积U×U上的一个模糊子集,其具有对称性和自反性,因此可以对R*进行分解,选用某一确定的阈值λ∈[0,1]作R*的截集,截得的普通子集就是U上的一个普通等价关系。目前对于模糊等价矩阵的求取,使用最广泛的方法是通过模糊相似矩阵R,并采用传递闭包方法求取模糊等价矩阵R*,其中常用的求取模糊相似矩阵R的方法有相似系数法和距离法。在本专利技术的应用中,传统的模糊传递闭包聚类算法不满足需要,主要体现在如下两个方面:(1)现有的模糊相似矩阵计算方法计算得到的数值与实际曲线相似度偏差较大;(2)现有的计算方法在计算相似度时,人眼直观不相似的两条曲线仍有一定的相似度。本专利技术将设计一种新的模糊相似矩阵的计算方法进行相应改进。模糊聚类是一种采用模糊数学语言对事物按一定的要求进行描述和分类的数学方法。Fuzzyc-means(FCM)算法是一种基于目标函数的模糊聚类算法,其基本思想是以KCM算法为根据,并引入模糊集的理念,从硬划分转变为软划分。FCM算法根据极小值条件计算出聚类中心和隶属度矩阵的迭代公式,通过迭代计算得到使目标函数达到最小值的聚类中心和隶属度矩阵,从而得到数据集的精确分类。FCM算法存在如下两方面的不足:(1)FCM算法的初始聚类中心较差时,系统容易陷入局部最优;(2)FCM算法对所有的异常数据无能为力,所有异常数据均被分类。本专利技术将对传统FCM算法进行改进并应用。该方法识别效率高,识别准确,能够甄别异常数据,鲁棒性好,为批量待测单晶晶体缺陷检测的实现提供了一种有效的方法。
技术实现思路
本专利技术的目的在于针对现阶段X射线定向仪存在的不足以及市场对于离线批量检测技术的需求,提出一种X射线定向仪缺陷识别的批量处理方法,包括如下步骤:步骤1:建立样本库,包括单晶晶体标准的和每种缺陷类型的标准回摆曲线数据样本,提取该样本中每条回摆曲线的特征向量,并保存样本每条回摆曲线的特征向量,作为样本库;步骤2:批量选取n个待测单晶晶体回摆曲线数据,对待测单晶晶体回摆曲线数据提取特征向量,用于表述曲线特征;步骤3:进行参数初始化,所述参数设置包括:聚类数目c及初始聚类中心V0,V0为迭代初始值,迭代停止阈值ε,最大迭代次数B,当前迭代次数b,初始化粒子位置PX0和速度PV0,设粒子的位置表示为PX=[PX1,…,PXPm]T,具体为PXp=[pxp1,…,pxpc]c×m,p∈[1,Pm],粒子的速度表示为PV=[PV1,…,PVPm]T,具体为PVp=[pvp1,…,pvpc]c×m,p∈[1,Pm],当前迭代中使得目标函数值最小时的个体最优PXpbest,群体最优PXgbest;Pm粒子群数量,m指特征向量维度;步骤4:使用改进的FCM聚类算法对所有特征向量进行聚类,得到聚类中心,以及所有特征向量对各聚类中心的隶属度矩阵;其中,改进的FCM聚类算法引入粒子群优化算法,进行迭代,得到优化后的聚类中心,以及所有特征向量与各聚类中心的隶属度矩阵;步骤5:计算有效半径VR=(VRk)c*1,根据数据聚类的判断准则,筛除异常数据;VRk为第k个聚类中心的有效半径,定义为如下公式:其中,n样本总数,c为聚类数目,其数值上与样本库样本总数相等,(VRk)c×1指VRk为c×1维的向量,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离,c1表示密度影响率,c2表示对异常数据的判断的严格程度,其中,ρk为密度函数,定义第k个聚类中心Vk的密度函数ρk为如下公式:其中,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离;uik表示第i个待测单晶晶体回摆曲线数据特征向量属于第k个聚类中心的隶属度,公式如下,其中,s为模糊指数,在实际应用中,其最佳取值范围为s∈(1.5,2.5),本专利技术取s=2;其中,Xi第i待测单晶晶体回摆曲线数据,Vk第k个聚类中心的隶属度,t≠k,指一种特殊情况,如果一条曲线和聚类中心距离为0则隶属度为1,那么和除了这条曲线t不等于k的中心的隶属度为0;对数据聚类的判断准则如下:若且h≠k,满足dik≤VRk且uik≥uih,k≠h时,则第i个数据归属于第k类;若满足dik≥VRk时,此时第i个数据属于异常数据;步骤6:使用改进的模糊传递闭包聚类算法对得到的聚类中心进行缺陷类型识别,进而得出所有待测单晶晶体回摆曲线对应的缺陷类型及其相似度;其中,改进的模糊传递闭包聚类算法改进了模糊相似矩阵,定义模糊相似矩阵为R=(rab),其中其中,rab为相似度,m为特征向量维度,x0j为取峰值不变的晶体衍射曲线数据为曲线的0相似度标准,即任何单晶材料曲线与其相似度均为0;xaj和xbj分别为第a个和第b个单晶晶体回摆曲线数据第j个特征,valueab为批量选取第a条单晶晶体回摆曲线数据特征向量和第b条样本的特征向量的欧氏距离,和该向量与零标准曲线的特征向量欧氏距离的相对值,β为经验参数。步骤1和步骤2中所述回摆曲线数据提取特征为Pattern=[Pattern1;Pattern2],其中Pattern1为主峰基本模式特征向量,表示主峰的参数,体现晶体的特性及主峰形状;Pattern2为峰形基本特征向量,表示从峰的数量、位置及曲线对称性,体现整体峰形轮廓。定义Angle为衍射角度的集合,anglei为第i个衍射角度;定义Peak为X射线衍射强度的集合,peaki为anglei所对应的X射线衍射强度,peaki*为归一化之后的衍射强度值;定义Scan为扫描范围,表示仪器在测量时扫描过的X射线衍射角度,单位为角度秒;定义Std_angle为标准衍射角度,表示理论上该晶体达到max(peaki)对应的角度;定义Main_angle为主峰角度,表示实际测量中本文档来自技高网
...

【技术保护点】
1.一种X射线定向仪缺陷识别的批量处理方法,其特征在于包括如下步骤:步骤1:建立样本库,包括单晶晶体标准的和每种缺陷类型的标准回摆曲线数据样本,提取该样本中每条回摆曲线的特征向量,并保存样本每条回摆曲线的特征向量,作为样本库;步骤2:批量选取n个待测单晶晶体回摆曲线数据,对待测单晶晶体回摆曲线数据提取特征向量,用于表述曲线特征;步骤3:进行参数初始化,所述参数设置包括:聚类数目c及初始聚类中心V0,V0为迭代初始值,迭代停止阈值ε,最大迭代次数B,当前迭代次数b,初始化粒子位置PX0和速度PV0,设粒子的位置表示为PX=[PX1,…,PXPm]T,具体为PXp=[pxp1,…,pxpc]c×m,p∈[1,Pm],粒子的速度表示为PV=[PV1,…,PVPm]T,具体为PVp=[pvp1,…,pvpc]c×m,p∈[1,Pm],当前迭代中使得目标函数值最小时的个体最优PXpbest,群体最优PXgbest;Pm粒子群数量,m指特征向量维度;步骤4:使用改进的FCM聚类算法对所有特征向量进行聚类,得到聚类中心,以及所有特征向量对各聚类中心的隶属度矩阵;其中,改进的FCM聚类算法引入粒子群优化算法,进行迭代,得到优化后的聚类中心,以及所有特征向量与各聚类中心的隶属度矩阵;步骤5:计算有效半径VR=(VRk)c×1,根据数据聚类的判断准则,筛除异常数据;VRk为第k个聚类中心的有效半径,定义为如下公式:...

【技术特征摘要】
1.一种X射线定向仪缺陷识别的批量处理方法,其特征在于包括如下步骤:步骤1:建立样本库,包括单晶晶体标准的和每种缺陷类型的标准回摆曲线数据样本,提取该样本中每条回摆曲线的特征向量,并保存样本每条回摆曲线的特征向量,作为样本库;步骤2:批量选取n个待测单晶晶体回摆曲线数据,对待测单晶晶体回摆曲线数据提取特征向量,用于表述曲线特征;步骤3:进行参数初始化,所述参数设置包括:聚类数目c及初始聚类中心V0,V0为迭代初始值,迭代停止阈值ε,最大迭代次数B,当前迭代次数b,初始化粒子位置PX0和速度PV0,设粒子的位置表示为PX=[PX1,…,PXPm]T,具体为PXp=[pxp1,…,pxpc]c×m,p∈[1,Pm],粒子的速度表示为PV=[PV1,…,PVPm]T,具体为PVp=[pvp1,…,pvpc]c×m,p∈[1,Pm],当前迭代中使得目标函数值最小时的个体最优PXpbest,群体最优PXgbest;Pm粒子群数量,m指特征向量维度;步骤4:使用改进的FCM聚类算法对所有特征向量进行聚类,得到聚类中心,以及所有特征向量对各聚类中心的隶属度矩阵;其中,改进的FCM聚类算法引入粒子群优化算法,进行迭代,得到优化后的聚类中心,以及所有特征向量与各聚类中心的隶属度矩阵;步骤5:计算有效半径VR=(VRk)c×1,根据数据聚类的判断准则,筛除异常数据;VRk为第k个聚类中心的有效半径,定义为如下公式:其中,n样本总数,c为聚类数目,其数值上与样本库样本总数相等,(VRk)c×1指VRk为c×1维的向量,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离,c1表示密度影响率,c2表示对异常数据的判断的严格程度,其中,ρk为密度函数,定义第k个聚类中心Vk的密度函数ρk为如下公式:其中,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离;uik表示第i个待测单晶晶体回摆曲线数据特征向量属于第k个聚类中心的隶属度,公式如下,其中,s为模糊指数;其中,Xi第i待测单晶晶体回摆曲线数据,Vk第k个聚类中心的隶属度,t≠k,指一种特殊情况,如果一条曲线和聚类中心距离为0则隶属度为1,那么和除了这条曲线t不等于k的中心的隶属度为0;对数据聚类的判断准则如下:若且h≠k,满足dik≤VRk且uik≥uih,k≠h时,则第i个数据归属于第k类;若满足dik≥VRk时,此时第i个数据属于异常数据;步骤6:使用改进的模糊传递闭包聚类算法对得到的聚类中心进行缺陷类型识别,进而得出所有待测单晶晶体回摆曲线对应的缺陷类型及其相似度;其中,改进的模糊传递闭包聚类算法改进了模糊相似矩阵,定义模糊相似矩阵为R=(rab),其中:其中,rab为相似度,m为特征向量维度,x0j为取峰值不变的晶体衍射曲线数据为曲线的0相似度标准,即任何单晶材料曲线与其相似度均为0;xaj和xbj分别为第a个和第b个单晶晶体回摆曲线数据第j个特征,valueab为批量选取第a条和第b条回摆曲线数据特征向量的欧氏距离,和该向量与零标准曲线的特征向量欧氏距离的相对值,β为经验参数。2.根据权利要求1所述一种X射线定向仪缺陷识别的批量处理方法,其特征在于,步骤1和步骤2中所述回摆曲线数据提取特征为Pattern=[Pattern1;Pattern2],其中Pattern1为主峰基本模式特征向量,表示主峰的参数,体现晶体的特性及主峰形状;Pattern2为峰形基本特征向量,表示从峰的数量、位置及曲线对称性,体现整体峰形轮廓;定义Angle为衍射角度的集合,anglei为第i个衍射角度;定义Peak为X射线衍射强度的集合,peaki为anglei所对应的X射线衍射强度,peaki*为归一化之后的衍射强度值;定义Scan为扫描范围,表示仪器在测量时扫描过的X射线衍射角度,单位为角度秒;定义Std_angle为标准衍射角度,表示理论上该晶体达到max(peaki)对应的角度;定义Main_angle为主峰角度,表示实际测量中该晶体达到max(peaki)对应的角度,其中,max(peaki)为X射线衍射强度的最大值;所述Patter...

【专利技术属性】
技术研发人员:关守平王玉勇
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1