基于主成分分析‑BP神经网络的包虫病患者血清的光谱识别方法技术

技术编号:15248552 阅读:52 留言:0更新日期:2017-05-02 10:09
本发明专利技术涉及光谱识别技术领域,是一种基于主成分分析‑BP神经网络的包虫病患者血清的光谱识别方法,其按下述步骤进行:第一步,分别吸取至少20名健康人和至少20名包虫病患者的血清,并将吸取的血清置于拉曼光谱仪中进行全波长扫描并进行采集数据;第二步,将采集的数据进行归一化处理;第三步,将进行归一化后的数据进行主成分分析,将主成分累计贡献率达到80%的所有主成分的得分作为BP神经网络的输入层节点。本发明专利技术采用基于主成分分析(PCA)和BP神经网络相结合的方法,建立了准确度较高的包虫病光谱诊断技术方案,诊断正确率高,操作方便,便于实施。

Spectrum identification method of hydatid disease serum principal component analysis based on BP neural network

The invention relates to the field of spectral identification technology, spectral identification method analysis BP neural network based on principal component of hydatid disease in the serum, which follows the following steps: the first step, we took the serum at least 20 healthy people and at least 20 hydatid disease patients, and serum in Raman spectrometer in drawing full wavelength scanning and data acquisition; the second step, the collected data are normalized; the third step, the normalized data were analyzed by principal component analysis, principal component accumulative contribution rate reached 80% of all the main points as the input nodes of BP neural network. The invention adopts the method of combining principal component analysis (PCA) and BP neural network to establish a high accuracy hydatid disease spectrum diagnosis technical scheme, which has the advantages of high accuracy, convenient operation and convenient implementation.

【技术实现步骤摘要】

本专利技术涉及光谱识别
,是一种基于主成分分析-BP神经网络的包虫病患者血清的光谱识别方法。
技术介绍
包虫病是一种在世界范围内传播的人畜共患疾病,我国现有50万包虫病例,受威胁人口达六千六百万以上,尤其是新疆,平均每年手术治疗病例就在2000例以上。目前包虫病的诊断方法主要有影像诊断,但是影像诊断方法最大的不足是仪器昂贵、操作费时,需专业人员操作,对于包虫病普查工作和一些非典型影像的病例带来很大的困难,而且不适用于基层和现场操作。另外,对于包虫病的诊断还发展出了一些基于血清的新方法,如免疫检测,但是免疫检测存在对血液标本的处理过程繁琐的问题。相对传统免疫检测对血液标本的繁琐处理过程,光谱技术由于具有实时、无破坏和原位鉴别诊断的优势,特别是针对疾病早期的诊断和鉴别。目前,国内外研究员在血液光谱的研究中已经取得了不少重要成果,其中主要涉及红外光谱、荧光光谱和拉曼光谱,相比荧光光谱和红外光谱而言,拉曼光谱具有光谱信息丰富,对样本无需预处理和受组织内水分影响小等优点,同时其谱带相对窄,不易重叠,能够提供更多的样本信息,有利于分析,成为临床光谱技术的应用热点。近年来,随着便携式拉曼光谱仪的快速发展,拉曼光谱在医学诊断中的应用日益增多,例如地中海贫血、糖尿病、恶性肿瘤的拉曼光谱技术诊断。此外,NaraharaChariDingari等通过对拉曼光谱数据进行不同的计算来研究侵袭性和原位性乳腺癌。LiShaoxin等通过多元统计方法和K近邻法来探讨应用于结肠癌诊断的可行性。周雪等对食管癌患者与健康人的血红蛋白表面拉曼光谱结合归一化和主成分分析进行统计分析,然而,将拉曼光谱技术应用于包虫病的临床诊断未见报道。
技术实现思路
本专利技术提供了一种基于主成分分析-BP神经网络的包虫病患者血清的光谱识别方法,克服了上述现有技术之不足,其能有效解决目前将拉曼光谱技术应用于包虫病的临床诊断未见报道的问题。本专利技术的技术方案是通过以下措施来实现的:一种基于主成分分析-BP神经网络的包虫病患者血清的光谱识别方法,按下述步骤进行:第一步,分别吸取至少20名健康人和至少20名包虫病患者的血清,并将吸取的血清置于拉曼光谱仪中进行全波长扫描并进行采集数据;第二步,将采集的数据进行归一化处理;第三步,将进行归一化后的数据进行主成分分析,将主成分累计贡献率达到80%的所有主成分的得分作为BP神经网络的输入层节点;第四步,输出节点数为1,经过实验分析对比,确定隐含层节点数,使用newff函数创建前馈神经网络,隐含层采用s型激活函数logsig,输出层采用线性激活函数purelin,训练函数采用trainlm,模型随机初始化后,输出神经元对健康人的输出值分别设定为1、输出神经元对包虫患者的输出值设定为2。下面是对上述专利技术技术方案的进一步优化或/和改进:上述根据BP神经网络隐含层采用s型激活函数logsig的要求输入参数分布在[0,1]之间,界定输入和输出值均在[0,1]的范围内,归一化算法采用公式:χi’=(χi-χmin)/(χmax-χmin),其中,χi为需要进行归一化处理的数据,χi’为归一化后的样本数据,χmin为χi中的最小值,χmax为χi中的最大值。本专利技术采用基于主成分分析(PCA)和BP神经网络相结合的方法,建立了准确度较高的包虫病光谱诊断技术方案,诊断正确率高,操作方便,便于实施。附图说明图1为本专利技术的拉曼光谱归一化反射率。图2为本专利技术的样本主成分1和主成分2得分。具体实施方式本专利技术不受下述实施例的限制,可根据本专利技术的技术方案与实际情况来确定具体的实施方式。本专利技术中所提到各种化学试剂和化学用品如无特殊说明,均为现技术中公知公用的化学试剂和化学用品;本专利技术中的百分数如没有特殊说明,均为质量百分数;本专利技术中的水如没有特殊说明,为自来水或纯净水;本专利技术中的溶液若没有特殊说明,均为溶剂为水的水溶液,例如,盐酸溶液即为盐酸水溶液;本专利技术中的常温一般指15℃到25℃的温度,一般定义为25℃。下面结合实施例及附图对本专利技术作进一步描述:实施例1,该基于主成分分析-BP神经网络的包虫病患者血清的光谱识别方法,按下述步骤进行:第一步,分别吸取至少20名健康人和至少20名包虫病患者的血清,并将吸取的血清置于拉曼光谱仪中进行全波长扫描并进行采集数据;拉曼光谱仪可以采用horiba公司的拉曼光谱仪,利用配套软件LabSpec6进行采集数据;第二步,将采集的数据进行归一化处理;为消除仪器在采集光谱时由光源干扰、采集方法等产生的噪声,需在分析前先对采集的原始数据进行预处理,本专利技术采用归一化预处理采集的原始数据以消除由光散射、样品不均匀等产生的影响;第三步,将进行归一化后的数据进行主成分分析,将主成分累计贡献率达到80%的所有主成分的得分作为BP神经网络的输入层节点;如果将光谱数据直接作为变量输入神经网络进行建模,不仅会因变量太多而增加建模难度,而且会引入噪声而降低预测精度,数据经降维后,既能有效除噪,又能最大限度地保留原始数据的结构特征,从而提高样本计算效率,降低其所需空间,通常情况下当前面几个主成分的累积方差贡献率达到大于80%时,后面的主成分便可舍去;第四步,输出节点数为1,经过实验分析对比,确定隐含层节点数,使用newff函数创建前馈神经网络,隐含层采用s型激活函数logsig,输出层采用线性激活函数purelin,训练函数采用trainlm,模型随机初始化后,输出神经元对健康人的输出值分别设定为1、输出神经元对包虫患者的输出值设定为2;本专利技术可以选用由MATLABR2012b神经网络工具箱提供的mapminmax函数将输入数据和与之对应的输出数据进行归一化处理,使处理后数据全部落在[0,1]范围内,以去除噪声的干扰,提高拉曼信号的质量,然后再将归一化后的数据进行主成分分析。实施例2,该根据BP神经网络隐含层采用s型激活函数logsig的要求输入参数分布在[0,1]之间,界定输入和输出值均在[0,1]的范围内,归一化算法采用公式:χi’=(χi-χmin)/(χmax-χmin),其中,χi为需要进行归一化处理的数据,χi’为归一化后的样本数据,χmin为χi中的最小值,χmax为χi中的最大值。1、实验与方法1.1血液样品及仪器血液:随机取出诊断明确、资料完整的健康人38例,包虫病患者28例,由新疆医科大学第一附属医院提供。仪器:实验使用horiba公司的拉曼光谱仪,测定波长范围101.298nm至3999.76nm,分辨率小于0.02nm,光源和光纤采用定制的激光光源及其配套光纤。利用配套软件LabSpec6采用本专利技术的方法进行采集数据,采集到的数据通过USB口进入计算机。1.2数据预处理为消除仪器在采集光谱时由光源干扰、采集方法等产生的噪声,需在分析前先对原始数据进行预处理。本文采用归一化预处理光谱数据以消除由光散射、样品不均匀等产生的影响,且由于神经网络s型激活函数logsig要求输入参数分布在[0,1]之间,由此界定输入和输出值均在[0,1]的范围内。归一化算法采用公式:χi’=(χi-χmin)/(χmax-χmin),其中,χi为需要进行归一化处理的数据,χi’为归一化后的样本数据,χmin为χi中的最小值,χmax为χ本文档来自技高网
...

【技术保护点】
一种基于主成分分析‑BP神经网络的包虫病患者血清的光谱识别方法,其特征在于按下述步骤进行:第一步,分别吸取至少20名健康人和至少20名包虫病患者的血清,并将吸取的血清置于拉曼光谱仪中进行全波长扫描并进行采集数据;第二步,将采集的数据进行归一化处理;第三步,将进行归一化后的数据进行主成分分析,将主成分累计贡献率达到80%的所有主成分的得分作为BP神经网络的输入层节点;第四步,输出节点数为1,经过实验分析对比,确定隐含层节点数,使用newff函数创建前馈神经网络,隐含层采用s型激活函数logsig,输出层采用线性激活函数purelin,训练函数采用trainlm,模型随机初始化后,输出神经元对健康人的输出值分别设定为1、输出神经元对包虫患者的输出值设定为2。

【技术特征摘要】
1.一种基于主成分分析-BP神经网络的包虫病患者血清的光谱识别方法,其特征在于按下述步骤进行:第一步,分别吸取至少20名健康人和至少20名包虫病患者的血清,并将吸取的血清置于拉曼光谱仪中进行全波长扫描并进行采集数据;第二步,将采集的数据进行归一化处理;第三步,将进行归一化后的数据进行主成分分析,将主成分累计贡献率达到80%的所有主成分的得分作为BP神经网络的输入层节点;第四步,输出节点数为1,经过实验分析对比,确定隐含层节点数,使用newff函数创建前馈神经网络,隐含层采用s型激活函数logsig,输出层采用线性激活函数pureli...

【专利技术属性】
技术研发人员:温浩吕国栋程金盈吕小毅莫家庆刘辉林仁勇卢晓梅李亮毕晓娟张传山杨宁
申请(专利权)人:新疆医科大学第一附属医院
类型:发明
国别省市:新疆;65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1