【技术实现步骤摘要】
基于seq2seq算法的电子显微镜机时计算方法
[0001]本专利技术属于数据分析
,具体设计一种基于seq2seq算法的电子显微镜机时计算方法。
技术介绍
[0002]如今社会正在进入大数据时代,随着数据采集技术的不断提高以及数据采集产品越来越多,可提供给人们进行分析处理的数据也在不断增多。同时,随着高校科研的进一步发展,仪器的数量以及种类越来越多,而实验技术人员有限,这些大型仪器普遍存在着仪器闲置率高、仪器使用时长不清晰等问题,而仪器机时(关机机时、待机机时、工作机时)可以清晰地反映仪器的工作状态,对于仪器管理有着重要作用。利用大数据分析及挖掘技术等,通过传感器采集大型仪器的电流并且通过大数据分析算法提取仪器的机时信息的需求亟待解决。
[0003]对于此类问题,通常是提取一台仪器的特征值,通过机器学习中的聚类或者分类算法来对数据点进行分类,例如文献[胡锋,朱承治,汪志华.基于改进K
‑
means算法的电力负荷分类研究[J].电子测量技术,2018]提出了一种基于改进K
‑
means算法的电力负荷分类方法,对电力负荷的特性进行了聚类,但是这种方式如果数据的类型不平衡,比如数据量严重失衡或者类别的方差不同,则聚类效果不佳。又如文献[刘永梅,杜松怀,盛万兴.基于AdaBoost算法的剩余电流分类方法[J].电子技术应用,2018]提出一种利用AdaBoost算法的剩余电流分类方法,该方法首先通过提取实验获取不同类型剩余电流分量的特征分量,而后将这些分量特征映射到AdaB ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于seq2seq算法的电子显微镜机时计算方法,包括如下步骤:(1)针对电子显微镜类的科学仪器,建立关于其运行电流的数据集;(2)对数据集进行预处理,并将整个数据集划分成训练集和测试集;(3)构建基于seq2seq算法的状态预测模型,其由编码器、注意力机制层以及解码器依次连接组成,编码器用于对输入的电流数据进行特征编码,注意力机制层用于为特征信息中不同的隐层状态赋予不同的权重,解码器用于对特征信息进行解码得到仪器每一时刻的状态概率分布;(4)利用训练集的电流数据对状态预测模型进行训练;(5)将测试集的电流数据输入至训练好的模型中,即可预测得到仪器每一时刻的状态指示,进而对仪器工作运行状态的持续时间进行统计。2.根据权利要求1所述的电子显微镜机时计算方法,其特征在于:所述步骤(1)的具体实现方式为:首先从仪器后台管理系统的数据库中筛选出多组关于扫描电子显微镜和透射电子显微镜的运行电流序列,该序列具有完整电流周期包含周期内各个时刻的电流值;然后为运行电流序列中每个电流值打上标签得到对应的标签序列,即对于任一时刻的电流值,若该时刻仪器处于工作运行状态,对应标签赋值为2;若该时刻仪器处于待机状态,对应标签赋值为1;该时刻仪器处于关机状态,对应标签赋值为0;进而将运行电流序列及其对应的标签序列组合作为一组电流数据,依此得到多组电流数据从而组建构成数据集。3.根据权利要求2所述的电子显微镜机时计算方法,其特征在于:所述步骤(2)中对数据集进行预处理的具体实现方式为:首先对数据集中的运行电流序列进行归一化处理,然后将运行电流序列转换分成各个时刻的电流输入向量,即对于运行电流序列中任一时刻t的电流值i
t
,根据预设窗口大小w取i
t
及其前w个时刻的电流值组成t时刻的电流输入向量,若其中的电流值数量不足w+1,则复制i
t
进行补全;依此遍历运行电流序列中各个时刻的电流值,从而得到各个时刻的电流输入向量。4.根据权利要求3所述的电子显微镜机时计算方法,其特征在于:所述编码器采用BiLSTM网络,其包含了前向和后向两个LSTM单元,具体计算表达式如下:其中:H为编码器输出的编码特征向量,h
t
为BiLSTM网络在t时刻的隐层状态,t为自然数且1≤t≤m,m为运行电流序列的时间长度,x
t
为t时刻的电流输入向量,和分别为前向LSTM单元在t时刻和t
‑
1时刻的隐层状态,和分别为后向LSTM单元在t时刻和t+1时刻的隐层状态,BiLSTM
+
( )和BiLSTM
‑
( )分别表示前向LSTM单元和后向LSTM单元的内部计算函数。
技术研发人员:陈宁,陈盼,何世伟,叶宗昆,陈科明,
申请(专利权)人:杭州轨物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。