【技术实现步骤摘要】
可解释集成学习的间歇过程质量在线预测方法
[0001]本专利技术涉及的是一种信息处理领域的技术,具体是一种可解释集成学习的间歇过程质量在线预测方法。
技术介绍
[0002]间歇生产过程已被广泛应用于精细化工、生物制药、食品加工等诸多领域。由于涉及非常复杂的物理化学反应,并受到外部不确定因素的极大干扰,间歇过程的最终产品质量难以保持稳定,因此生产现场需要及时调整工艺参数。然而,最终产品质量只能在生产结束后进行离线测量,质量反馈严重滞后,且需要较高的人力和时间成本,设计准确性高、解释性强的质量在线预测方法已成为必然选择。
[0003]现有针对间歇过程质量预测的研究大致分为第一性原理方法和数据驱动方法。前者通过物理、化学实验或仿真,并借助统计学模型来推理实际工业过程的因果关系,只有深刻理解其中的物理化学规律,该类方法才能很好地发挥作用。随着数据采集和机器学习等技术的广泛应用,数据驱动方法已成为间歇过程质量预测研究的主流,其重点在于挖掘数据中的关联关系,而不试图反映实际工业过程的因果关系,例如偏最小二乘(PLS)、主成分分析 ...
【技术保护点】
【技术特征摘要】
1.一种可解释集成学习的间歇过程质量在线预测方法,其特征在于,通过传感器采集的间歇过程历史数据集建立最终产品质量模型,经数据预处理得到候选输入变量;分时段计算候选输入变量与最终产品质量之间的Copula熵并进行排序,选取Copula熵最大的前M个候选输入变量作为关键变量;根据最终产品质量模型设计堆叠集成随机森林算法,训练该堆叠集成随机森林算法后,利用训练得到的堆叠集成随机森林算法对间歇过程的最终产品质量进行在线预测。2.根据权利要求1所述的可解释集成学习的间歇过程质量在线预测方法,其特征是,所述的间歇过程历史数据集包括:时段无关变量V
u
,时段相关变量V
r,k
,最终产品质量指标Y。3.根据权利要求1或2所述的可解释集成学习的间歇过程质量在线预测方法,其特征是,所述的最终产品质量模型,即时段无关变量以及时段相关变量在每个时间点产生影响的加权叠加:其中:Y为某一批次的最终产品质量,Q0、Q
k
分别表示V
u
和V
r
对最终产品质量的局部影响,ω0、ω
k
分别表示局部影响的权值,考虑间歇过程的多时段特性,在每个时段提取时段相关变量的时序特征,从时段无关变量和每个时段的时序特征中选择最终产品质量的关键变量集S
u
,S
r,p
,其中p=1,2,
…
,P表示P个时段;所述的时段无关变量产生的影响记为时段0,则最终产品质量模型公式化为所述的时段无关变量产生的影响记为时段0,则最终产品质量模型公式化为4.根据权利要求1所述的可解释集成学习的间歇过程质量在线预测方法,其特征是,所述的数据预处理是指在每个时段提取时段相关变量的6个时序特征,包括:均值方差极差max(x
j
)
‑
min(x
j
),中位数median(x
j
),偏度和峰度其中:表示变量x
j
的第k个样本点,N表示样本点的数目,表示N个样本点的均值。5.根据权利要求1所述的可解释集成学习的间歇过程质量在线预测方法,其特征是,所述的候选输入变量与最终产品质量之间的Copula熵通过K近邻方法进行近似估计,具体为:其中:k
N
为邻居数,为双伽马函数,ε
i
为第i个样本到最近邻的欧氏距离,c
D
=πD/[2Г(1+0.5D)],D=Q+1为u的维数,为修正项,u=[u0,u1,
…
,u
Q
]表示候选输入变量与最终产品质量的边际累积密度函数,通过秩统计量来估计,具体为:其中:i=1,
…
,I表示I个批次运行的数据样本,q=1,
…
,Q表示Q个最终产品质量指标,χ为秩统计量。6.根据权利要求1所述的可解释集成学习的间歇过程质量在线预测方法,其特征是,所述的堆叠集成随机森林算法,首先采用随机森林算法学习不同时段对最终产品质...
【专利技术属性】
技术研发人员:孙衍宁,谭润芝,王无印,许鸿伟,秦威,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。