当前位置: 首页 > 专利查询>上海大学专利>正文

基于强化学习的分布参数系统在线3D模糊建模方法及应用技术方案

技术编号:40540310 阅读:14 留言:0更新日期:2024-03-05 18:55
本发明专利技术涉及一种基于强化学习的分布参数系统在线3D模糊建模方法及应用,该方法包括以下步骤:步骤S1,基于分布参数系统中采集的传感数据,构造数据集,并构建马尔可夫决策过程模型;步骤S2,建立基于Actor‑Critic强化学习模型框架的分布参数系统在线3D模糊模型;步骤S3,优化分布参数系统在线3D模糊模型。与现有技术相比,本发明专利技术具有建模精度高、动态适应新数据、应用广泛、提升能源效率等优点。

【技术实现步骤摘要】

本专利技术涉及分布参数系统建模,尤其是涉及一种基于强化学习的分布参数系统在线3d模糊建模方法及应用。


技术介绍

1、近年来,尽管3d模糊系统开始在分布参数系统dps建模领域探索应用,但其实际应用还相对较少,发展尚处于初步阶段。3d模糊系统是一种基于模糊逻辑理论的系统,它能够处理具有三维空间坐标的数据。这种系统的核心是模糊集合和模糊运算,它们允许处理不确定、不精确或模糊的信息。在3d模糊系统中,数据通常被分为几个模糊集合,这些集合对应于输入空间的特定区域。每个模糊集合都有一个对应的隶属度函数,用于确定输入数据属于该集合的程度。通过将输入数据与这些隶属度函数进行比较,可以得到输入数据属于每个集合的隶属度。

2、3d模糊系统的另一个重要特点是模糊运算。传统的数学运算通常只关注精确值,而模糊运算则考虑了输入数据的隶属度。例如,两个模糊集合的模糊加法可能产生一个新的模糊集合,其隶属度函数是两个输入集合隶属度函数的最大值。这种运算方式使得系统能够更好地处理不确定性和模糊性。3d模糊系统内部自然而然的实现了时空分离与时空综合,与传统的基于降维的建模方法相比,本文档来自技高网...

【技术保护点】

1.一种基于强化学习的分布参数系统在线3D模糊建模方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种基于强化学习的分布参数系统在线3D模糊建模方法,其特征在于,所述的步骤S1具体包括:

3.根据权利要求1所述的一种基于强化学习的分布参数系统在线3D模糊建模方法,其特征在于,所述的步骤S1中,构造数据集具体为:

4.根据权利要求1所述的一种基于强化学习的分布参数系统在线3D模糊建模方法,其特征在于,所述的步骤S1中,构建马尔可夫决策过程模型具体为:构建马尔可夫决策过程(MDP)五元组(S,A,R,P,γ):

<p>5.根据权利要求...

【技术特征摘要】

1.一种基于强化学习的分布参数系统在线3d模糊建模方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种基于强化学习的分布参数系统在线3d模糊建模方法,其特征在于,所述的步骤s1具体包括:

3.根据权利要求1所述的一种基于强化学习的分布参数系统在线3d模糊建模方法,其特征在于,所述的步骤s1中,构造数据集具体为:

4.根据权利要求1所述的一种基于强化学习的分布参数系统在线3d模糊建模方法,其特征在于,所述的步骤s1中,构建马尔可夫决策过程模型具体为:构建马尔可夫决策过程(mdp)五元组(s,a,r,p,γ):

5.根据权利要求1所述的一种基于强化学习的分布参数系统在线3d模糊建模方法,其特征在于,所述的步骤s2中,建立基于actor-critic强化学习模型框架的分布参数系统在线3d模糊模型,包括确定输入输出、构建actor网络和critic网络、选择强化学习算法和参数、收集样本数据并进行训练优化、以及将训练好的3d模糊模型应用于实际系统并验证性能。

6.根据权利要求5所述的一种基于强化学习的分布参数系统在线3d模糊建模方法,其特征在于,所述的actor网络选择动作,critic网络评估动...

【专利技术属性】
技术研发人员:张宪霞周刚闫润斌
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1