基于seq2seq算法的电子显微镜机时计算方法技术

技术编号:36696007 阅读:32 留言:0更新日期:2023-02-27 20:08
本发明专利技术公开了一种基于seq2seq算法的电子显微镜机时计算方法,首先筛选出典型的扫描电子显微镜和透射电子显微镜的电流数据作为样本集,通过seq2seq算法结构训练模型,模型通过Encoder

【技术实现步骤摘要】
基于seq2seq算法的电子显微镜机时计算方法


[0001]本专利技术属于数据分析
,具体设计一种基于seq2seq算法的电子显微镜机时计算方法。

技术介绍

[0002]如今社会正在进入大数据时代,随着数据采集技术的不断提高以及数据采集产品越来越多,可提供给人们进行分析处理的数据也在不断增多。同时,随着高校科研的进一步发展,仪器的数量以及种类越来越多,而实验技术人员有限,这些大型仪器普遍存在着仪器闲置率高、仪器使用时长不清晰等问题,而仪器机时(关机机时、待机机时、工作机时)可以清晰地反映仪器的工作状态,对于仪器管理有着重要作用。利用大数据分析及挖掘技术等,通过传感器采集大型仪器的电流并且通过大数据分析算法提取仪器的机时信息的需求亟待解决。
[0003]对于此类问题,通常是提取一台仪器的特征值,通过机器学习中的聚类或者分类算法来对数据点进行分类,例如文献[胡锋,朱承治,汪志华.基于改进K

means算法的电力负荷分类研究[J].电子测量技术,2018]提出了一种基于改进K

means算法的电力负荷分类方法,对电力负荷的特性进行了聚类,但是这种方式如果数据的类型不平衡,比如数据量严重失衡或者类别的方差不同,则聚类效果不佳。又如文献[刘永梅,杜松怀,盛万兴.基于AdaBoost算法的剩余电流分类方法[J].电子技术应用,2018]提出一种利用AdaBoost算法的剩余电流分类方法,该方法首先通过提取实验获取不同类型剩余电流分量的特征分量,而后将这些分量特征映射到AdaBoost的算法之中,利用AdaBoost算法检测出总剩余电流中的触电电流分量类型,但是这种方法需要先提取特征值,根据电流区间的特征值对区间进行分类,这对于特征值的选取要求较为苛刻。
[0004]上述两种方法忽视了电流数据的序列特性,无法挖掘序列中的规律性,电流数据是在相等间隔的时间段内按照指定的采样率对仪器电流进行采样的结果,具有数据连续性强、时间点紧密、相关变量多等特点,每个变量的变化不仅仅取决于它的历史数据值,还依赖于其它相关变量对它的影响。因此同一类型仪器的电流可能存在相同的规律,对同一类仪器的电流进行训练,就可以得到该类仪器的通用模型。

技术实现思路

[0005]鉴于上述,本专利技术提供了一种基于seq2seq算法的电子显微镜机时计算方法,整合了同类型科学仪器的电流信息,通过这些电流信息训练出同类型仪器的通用模型,对同一类科学仪器的机时进行较为准确的预测,具有较大的工程价值。
[0006]一种基于seq2seq算法的电子显微镜机时计算方法,包括如下步骤:(1)针对电子显微镜类的科学仪器,建立关于其运行电流的数据集;(2)对数据集进行预处理,并将整个数据集划分成训练集和测试集;(3)构建基于seq2seq算法的状态预测模型,其由编码器、注意力机制层以及解码
器依次连接组成,编码器用于对输入的电流数据进行特征编码,注意力机制层用于为特征信息中不同的隐层状态赋予不同的权重,解码器用于对特征信息进行解码得到仪器每一时刻的状态概率分布;(4)利用训练集的电流数据对上述模型进行训练;(5)将测试集的电流数据输入至训练好的模型中,即可预测得到仪器每一时刻的状态指示,进而对仪器工作运行状态的持续时间进行统计。
[0007]进一步地,所述步骤(1)的具体实现方式为:首先从仪器后台管理系统的数据库中筛选出多组关于扫描电子显微镜和透射电子显微镜的运行电流序列,该序列具有完整电流周期(待机、工作、关机)包含周期内各个时刻的电流值;然后为运行电流序列中每个电流值打上标签得到对应的标签序列,即对于任一时刻的电流值,若该时刻仪器处于工作运行状态,对应标签赋值为2;若该时刻仪器处于待机状态,对应标签赋值为1;该时刻仪器处于关机状态,对应标签赋值为0;进而将运行电流序列及其对应的标签序列组合作为一组电流数据,依此得到多组电流数据从而组建构成数据集。
[0008]进一步地,所述步骤(2)中对数据集进行预处理的具体实现方式为:首先对数据集中的运行电流序列进行归一化处理,然后将运行电流序列转换分成各个时刻的电流输入向量,即对于运行电流序列中任一时刻t的电流值i
t
,根据预设窗口大小w取i
t
及其前w个时刻的电流值组成t时刻的电流输入向量[i
t

w
,i
t

w+1
,

,i
t
‑1,i
t
],若其中的电流值数量不足w+1,则复制i
t
进行补全;依此遍历运行电流序列中各个时刻的电流值,从而得到各个时刻的电流输入向量。
[0009]进一步地,所述编码器采用BiLSTM网络,其包含了前向和后向两个LSTM单元,具体计算表达式如下:其中:H为编码器输出的编码特征向量,h
t
为BiLSTM网络在t时刻的隐层状态,t为自然数且1≤t≤m,m为运行电流序列的时间长度,x
t
为t时刻的电流输入向量,和分别为前向LSTM单元在t时刻和t

1时刻的隐层状态,和分别为后向LSTM单元在t时刻和t+1时刻的隐层状态,BiLSTM
+
( )和BiLSTM

( )分别表示前向LSTM单元和后向LSTM单元的内部计算函数。
[0010]进一步地,所述注意力机制层的计算表达式如下:
其中:C
t
为注意力机制层的输出即t时刻的时序向量,α
t
为隐层状态h
t
的权重值,v
t
为隐层状态h
t
的注意力分数,exp( )表示以自然常数e为底的指数函数,tanh( )表示双曲正切函数,V
e
和W
e
为待学习的权值矩阵,
T
表示转置,s
t
‑1为解码器在t

1时刻的隐层状态。
[0011]进一步地,所述解码器采用单向LSTM网络计算隐层状态s
t
,进而将隐层状态s
t
、注意力机制层的输出C
t
以及t

1时刻仪器的状态概率密度分布向量p
t
‑1拼接后通过全连接层降维得到t时刻仪器的状态概率密度分布向量p
t
作为模型输出。
[0012]进一步地,所述隐层状态s
t
的计算表达式如下:其中:s
t
为解码器在t时刻的隐层状态,p
t
‑1为t

1时刻仪器的状态概率密度分布向量,LSTM( )表示单向LSTM网络的内部计算函数。
[0013]进一步地,对于初始的隐层状态s0,其为通过全连接层对隐层状态h
m
降维后得到。
[0014]进一步地,所述步骤(4)中对模型进行训练的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于seq2seq算法的电子显微镜机时计算方法,包括如下步骤:(1)针对电子显微镜类的科学仪器,建立关于其运行电流的数据集;(2)对数据集进行预处理,并将整个数据集划分成训练集和测试集;(3)构建基于seq2seq算法的状态预测模型,其由编码器、注意力机制层以及解码器依次连接组成,编码器用于对输入的电流数据进行特征编码,注意力机制层用于为特征信息中不同的隐层状态赋予不同的权重,解码器用于对特征信息进行解码得到仪器每一时刻的状态概率分布;(4)利用训练集的电流数据对状态预测模型进行训练;(5)将测试集的电流数据输入至训练好的模型中,即可预测得到仪器每一时刻的状态指示,进而对仪器工作运行状态的持续时间进行统计。2.根据权利要求1所述的电子显微镜机时计算方法,其特征在于:所述步骤(1)的具体实现方式为:首先从仪器后台管理系统的数据库中筛选出多组关于扫描电子显微镜和透射电子显微镜的运行电流序列,该序列具有完整电流周期包含周期内各个时刻的电流值;然后为运行电流序列中每个电流值打上标签得到对应的标签序列,即对于任一时刻的电流值,若该时刻仪器处于工作运行状态,对应标签赋值为2;若该时刻仪器处于待机状态,对应标签赋值为1;该时刻仪器处于关机状态,对应标签赋值为0;进而将运行电流序列及其对应的标签序列组合作为一组电流数据,依此得到多组电流数据从而组建构成数据集。3.根据权利要求2所述的电子显微镜机时计算方法,其特征在于:所述步骤(2)中对数据集进行预处理的具体实现方式为:首先对数据集中的运行电流序列进行归一化处理,然后将运行电流序列转换分成各个时刻的电流输入向量,即对于运行电流序列中任一时刻t的电流值i
t
,根据预设窗口大小w取i
t
及其前w个时刻的电流值组成t时刻的电流输入向量,若其中的电流值数量不足w+1,则复制i
t
进行补全;依此遍历运行电流序列中各个时刻的电流值,从而得到各个时刻的电流输入向量。4.根据权利要求3所述的电子显微镜机时计算方法,其特征在于:所述编码器采用BiLSTM网络,其包含了前向和后向两个LSTM单元,具体计算表达式如下:其中:H为编码器输出的编码特征向量,h
t
为BiLSTM网络在t时刻的隐层状态,t为自然数且1≤t≤m,m为运行电流序列的时间长度,x
t
为t时刻的电流输入向量,和分别为前向LSTM单元在t时刻和t

1时刻的隐层状态,和分别为后向LSTM单元在t时刻和t+1时刻的隐层状态,BiLSTM
+
( )和BiLSTM

( )分别表示前向LSTM单元和后向LSTM单元的内部计算函数。

【专利技术属性】
技术研发人员:陈宁陈盼何世伟叶宗昆陈科明
申请(专利权)人:杭州轨物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1