一种自适应的颗粒物拉曼相似度判别方法技术

技术编号:34962553 阅读:38 留言:0更新日期:2022-09-17 12:42
本发明专利技术一种自适应的颗粒物拉曼相似度判别方法,包括计算待匹配光谱与数据库光谱拉曼位移交集区域,以适应不同波段拉曼光谱匹配;对所述交集区域进行插值拟合,以适应不同分辨率拉曼光谱匹配;提出基于DTW的拉曼光谱动态判别方法,即DTW算法,适应不同峰位、不同强度校准差异的拉曼光谱匹配;所述最短路径距离值转换为相似性,用于直观显示光谱相似性测度;克服现有医药领域基于拉曼光谱检测中,因为不同拉曼光谱仪厂商、不同波段范围、不同光谱分辨率、不同峰位校准以及不同强度校准,导致无法计算相似度或计算结果不准确的问题。法计算相似度或计算结果不准确的问题。法计算相似度或计算结果不准确的问题。

【技术实现步骤摘要】
一种自适应的颗粒物拉曼相似度判别方法


[0001]本专利技术涉及拉曼检测
,尤其是一种自适应的颗粒物拉曼相似度判别方法。

技术介绍

[0002]不溶性微粒(本专利也称颗粒物)是药典规范中一项重要的检测指标,注射液中不溶性微粒所引起的医药安全问题,受到众多研究人员的关注,由于传统检测方法的局限性,使得注射液中不溶性微粒的检测判断较低,对注射液的质量控制产生不利影响。
[0003]拉曼光谱技术是一种非侵入、免标记、快速、实时、灵敏、精准的检测方法,正在快速地成为颗粒表征工具库的一项关键技术。基于拉曼光谱技术的颗粒物检测,利用拉曼光谱技术的检测优势能够快速地鉴定出未知颗粒物的化学成分,为抗体蛋白制剂、细胞及基因制剂和生物疫苗产品的药物发现、配方开发、工艺优化、稳定性研究、生产偏差调查、质量控制和投诉处理提供强有力的依据。
[0004]颗粒物拉曼光谱数据库系统能帮助建立稳定、快捷的定性分析模型、定量分析模型以及特征分析模型等,在拉曼光谱数据库系统中,准确、高效的光谱匹配检索算法是整个系统有效运行的关键。
[0005]但现有技术中,拉曼光谱匹配检索算法多以相同像素长度、相同分辨率和相同的波段范围为基准进行相似度计算,计算准确性还要建立在拉曼光谱仪相同的峰位校准和强度校准基础上,现有算法的准确率己无法满足光谱数据库系统的要求。

技术实现思路

[0006]为了克服现有技术的不足,本专利技术提供一种自适应的颗粒物拉曼相似度判别方法,旨在克服现有医药领域基于拉曼光谱检测中,因为不同拉曼光谱仪厂商、不同波段范围、不同光谱分辨率、不同峰位校准以及不同强度校准,导致无法计算相似度或计算结果不准确的问题。
[0007]一种自适应的颗粒物拉曼相似度判别方法,包括如下步骤:
[0008]步骤一:计算待匹配光谱与数据库光谱拉曼位移交集区域,以适应不同波段拉曼光谱匹配;
[0009]其中,设待匹配光谱MS的拉曼位移集合为:{MS|ms
min
<=MS<=ms
max
},ms
min
表示待匹配光谱的起始波数,ms
max
表示终止波数;数据库光谱DS的拉曼位移集合为:{DS|ds
min
<=DS<=ds
max
},ds
min
表示数据库光谱起始波数,ds
max
表示终止波数。本专利覆盖如下可匹配范围波段:
[0010]波段范围1:{(ms
min
>ds
min
)and(ms
max
<ds
max
)}
[0011]波段范围2:{(ms
min
>=ds
min
)and(ms
min
<ds
max
)and(ms
max
>ds
max
)}
[0012]波段范围3:{(ms
min
<ds
min
)and(ms
max
>ds
min
)and(ms
max
<=ds
max
)}
[0013]波段范围4:{(ms
min
<=ds
min
)and(ms
max
>=ds
max
)}
[0014]计算所述波段范围1至波段范围4,得出四种波段范围的交集区域为:{MS,DS|s
min
<=MS,DS<=s
max
};
[0015]步骤二:对所述交集区域进行插值拟合,以适应不同分辨率拉曼光谱匹配;
[0016]进一步的,所述插值拟合采用MS为模板对DS进行插值拟合,也可以采用DS为模板对MS进行插值拟合;
[0017]进一步的,所述交集区域的插值拟合方法包括但不限于:Lagrange插值、Newton插值、Hermite插值、样条插值和/或多项式拟合、高斯拟合、洛伦兹拟合等;
[0018]步骤三:提出基于DTW(动态时间规整)的拉曼光谱动态判别方法,即DTW算法,适应不同峰位、不同强度校准差异的拉曼光谱匹配;
[0019]进一步的,根据精度要求,在步骤二中的所述交集区域自定义插值点,不同拉曼光谱仪厂商使用峰位和强度校准算法不同,导致拉曼光谱峰位和相对强度不统一;设交集区域内光谱插值点个数为N,由于峰位校准不统一,可能导致相同样品光谱特征峰位出现点不一致,以及相同特征峰位相对强度不标准,通过基于DTW的拉曼光谱动态判别方法寻找一个时间规整函数,将N个光谱像素点用MS为模板非线性地映射到DS上或用DS为模板非线性地映射到MS上,使该函数满足两个光谱N*N像素矢量之间的距离测度最小,即最短路径距离值;
[0020]进一步的,所述基于DTW的拉曼光谱动态判别方法匹配过程就是寻找一条从点(1,1)到(N,N)的最短路径距离值d[i,j],伪代码为:
[0021]For i=1~N
[0022]For j=1~N
[0023]{a[i][j]=DS的第i个像素点和MS的第j个像素点的特征参量距离;}
[0024]do
[0025]{d[i,j]=min{a[i,j]a[i,j+1],a[i,j+2]};
[0026]i++;j++;
[0027]}while
[0028]步骤四:所述最短路径距离值转换为相似性,用于直观显示光谱相似性测度。
[0029]进一步的,4种最短路径距离值转换为相似性方法:
[0030]①
{d[i,j]|d[i,j]>1},光谱相似性similarity[MS,DS]=1/d[i,j][0031]②
{d[i,j]|0<=d[i,j]<=1},光谱相似性similarity[MS,DS]=1

d[i,j][0032]③
{d[i,j]|d[i,j]>0},光谱相似性similarity[MS,DS]=1/e
d[i,j][0033]④
{d[i,j]|d[i,j]>0},光谱相似性similarity[MS,DS]=1/(1+d[i,j])
[0034]其中,d[i,j]表示第i和j个光谱之间的DTW最短路径距离,similarity[MS,DS]表示待匹配光谱和数据库光谱相似性测量值。
[0035]本专利技术的有益效果:
[0036]本专利技术提供提出一种自适应的颗粒物拉曼相似度判别方法,旨在克服现有医药领域基于拉曼光谱检测中,因为不同拉曼光谱仪厂商、不同波段范围、不同光谱分辨率、不同峰位校准以及不同强度校准,导致无法计算相似度或计算不准确的问题。
[0037]通过计算待匹配光谱与数据库光谱拉曼位移交集,解决不同波段拉曼光谱匹配问题;通过对交集区域进行插值拟合,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应的颗粒物拉曼相似度判别方法,其特征在于,包括如下步骤:步骤一:计算待匹配光谱与数据库光谱拉曼位移交集区域,以适应不同波段拉曼光谱匹配;其中,设待匹配光谱MS的拉曼位移集合为:{MS|ms
min
<=MS<=ms
max
},ms
min
表示待匹配光谱的起始波数,ms
max
表示终止波数;数据库光谱DS的拉曼位移集合为:{DS|ds
min
<=DS<=ds
max
},ds
min
表示数据库光谱起始波数,ds
max
表示终止波数;本专利覆盖如下可匹配范围波段:计算所述波段范围1至波段范围4,得出四种波段范围的交集区域为:{MS,DS|s
min
<=MS,DS<=s
max
};步骤二:对所述交集区域进行插值拟合,以适应不同分辨率拉曼光谱匹配;所述插值拟合采用MS为模板对DS进行插值拟合,也可以采用DS为模板对MS进行插值拟合;所述交集区域的插值拟合方法包括但不限于:Lagrange插值、Newton插值、Hermite插值、样条插值和/或多项式拟合、高斯拟合、洛伦兹拟合;步骤三:提出基于DTW的拉曼光谱动态判别方法,即DTW算法,适应不同峰位、不同强度校准差异的拉曼光谱匹配;根据精度要求,在步骤二中的所述交集区域自定义插值点,不同拉曼光谱仪厂商使用峰位和强度校准算法不同,导致拉曼光谱峰位和相对强度不统一;设交集区域内光谱插值点个数为N,由于峰位校准不统一,可能导致相同样品光谱特征峰位出现点不一致,以及相同特征峰位相对强度不标准,通过基于DTW的拉曼光谱动态判别方法寻找一个时间规整函数,将N个光谱像素点用MS为模板非线性地映射到DS上或用DS为模板非线性地映射到MS上,使该函数满足两个光谱N*N像素矢量之间的距离测度最小,即最短路径距离值;步骤四:所述最短路径距离值转换为相似性,用于直观显示光谱相似性测度;4种最短路径距离值...

【专利技术属性】
技术研发人员:李新立赵银苹刘闯洪喜
申请(专利权)人:长光辰英杭州科学仪器有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1