【技术实现步骤摘要】
基于自编码和极限学习机的药品分类方法
[0001]本专利技术涉及一种药品分类方法,特别涉及一种基于自编码器和极限学习机的药品分类方法。
技术介绍
[0002]目前虽然深度学习已广泛应用于图像、语音、文本等领域,且均取得了不错的成绩,但是在近红外光谱上的应用还是偏少,因为近红外本质是一维向量,且数据集往往都不大,深度学习虽然有很强的学习能力,但是容易过拟合,且传统的深度学习网络结构不太适合处理一维数据。目前近红外光谱分类主要还是采用机器学习的方法,例如反向传播算法(BP)、支持向量机(SVM)、极限学习机等,且这些算法都展现出比较强大的性能。但是这些机器学习算法也有自身的缺陷,例如BP算法容易陷入局部最小,SVM分类性能不稳定,计算复杂度高,ELM 虽然能极大提升学习速度但是效果不稳定。
[0003]另一个不容忽视的问题是数据降维的问题,药品的近红外光谱数据往往含有上百个变量,但并不是所有变量都对药品分类有贡献。特征选择和特征提取方法能够有效获取近红外光谱数据的主要特征,还能实现数据的降维,剔除无关的变量特征。所以除了 ...
【技术保护点】
【技术特征摘要】
1.基于自编码和极限学习机的药品分类方法,已知药品数据大小为m
×
p,表示共有m个药品,每个药品有p个特征,其特征在于包括以下步骤:步骤1,数据准备阶段:利用双波段变换将药品的一维光谱数据变换到二维空间,每个药品包含p
×
p个特征,将药品数据分为训练集和测试集,训练集用来训练AF
‑
ELM模型,测试集用来检验模型的预测性能;步骤2,训练模型:训练AE自编码器网络,药品训练集x作为自编码网络的输入,通过映射函数s
f
输出到隐藏层h,然后隐藏层的数据h通过映射函数s
g
重构到输出层y,大小与输入数据x相同,这两个过程表示如下:h=f(x)=s
f
(Wx+b
h
)
ꢀꢀꢀꢀꢀꢀ
(1)y=g(h)=s
g
(w
T
h+b
y
)
ꢀꢀꢀꢀ
(2)其中,W是连接输入层到隐藏层的权重矩阵,W
T
是W的转置;b
h
为隐藏层的偏置,b
y
为输出层的偏置,s
f
和s
g
都是非线性激活函数,自编码网络的学习过程就是通过反向传播算法不断减小输出值与药品二维特征之间的重构误差,优化参数W,b
h
,b
y
,其中重构误差表达式如下:其中,D
n
表示药品训练集,L为重构误差,这里采用均方误差L(x,y)=||x
‑
y||2,而J(θ)表示每个药品重构误...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。