具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根制造技术

技术编号:33133337 阅读:77 留言:0更新日期:2022-04-17 00:54
本发明专利技术公开了具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根,首先对原始问题进行抽象与建模,将问题转化为求解时变矩阵平方根的数学模型,之后将该数学模型通过求导和克罗内克积转化为动态矩阵线性方程问题,采用非凸激活和噪声抑制零化神经网络进行迭代求解,在求解的过程中不断对系统残差以及状态变量进行映射及变换,调整网络的求解策略。最终当迭代求解出的模型系统满足预定义的条件及精度后停止迭代并输出模型系统。和传统的其他求解时变矩阵平方根的方法相比,本发明专利技术算法有更高的收敛精度、收敛速度和鲁棒性。收敛速度和鲁棒性。收敛速度和鲁棒性。

【技术实现步骤摘要】
具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根


[0001]本专利技术涉及矩阵方程及神经网络
,具体涉及非凸激活和噪声抑制零化神经网络(A Non

convex Activation and Noise

suppressing Zeroing Neural Network)求解时变矩阵平方根的方法。

技术介绍

[0002]求解矩阵平方根问题已成为许多科学和工程领域的一个重要研究方向。例如,控制与优化理论领域,以及卡尔曼滤波和信号处理。一般来说,传统的算法只能用于解决与静态矩阵相关的平方根问题,但不能解决与时变(或动态)矩阵相关的问题。事实上,大多数现有算法无法直接应用于时效性强的领域。然而,递归神经网络方法通过并行分布性质和可能的硬件实现能力获得与时变矩阵相关的精确解。因此,发展一些递归神经网络方法来解决时变矩阵平方根(TMSR)问题是非常自然的。值得注意的是,已有大量研究致力于用梯度神经网络解决TMSR问题,但这些传统的梯度神经网络在面对大规模时变问题时存在严重的滞后误差,从而导致求解精度不足,甚至导致求解系统崩溃。而零化神经网络(OZNN模型)可以利用时间导数信息对误差函数进行调零,有效求解相关问题。因此,基于OZNN模型构建解决TMSR问题的模型可以极大地提高效率和精度。但是,在各种形式的干扰噪声下,传统的OZNN模型的精度会大大降低。此外,其收敛速度和求解精度往往不能满足工程要求。为了解决这些问题,许多研究工作人员引入了积分反馈项来解决这些问题。但是现有的方法无法有效解决凸集合上的问题,同时收敛速度和在噪声干扰下的精度也有限,因此,本文结合上述调零型神经网络模型的优点,提出了一种具有非凸激活和噪声抑制特性的新型零化神经网络模型(NANSZNN),并首次将其应用于解决干扰噪声的TMSR问题。该模型不仅解决了传统方法的问题,还能在各种噪声的干扰下保持高精度和快的收敛速度,同时也能保证系统的鲁棒性。

技术实现思路

[0003](一)解决的技术问题
[0004]本专利技术的目的在于提供具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根,解决了传统算法的无法因对时变连续代数问题、复杂度高、收敛速度慢、精度低等问题。此外,突破了现有神经网络无法在非凸集合上有效使用,进一步扩展了零化神经网络的引用范围。
[0005](二)技术方案
[0006]具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根,包括以下步骤:
[0007]步骤1:输入原始实际问题(例如机械臂移动规划,图像处理等实际问题);
[0008]步骤2:根据输入的原始实际问题,抽象与建模得到其中的隐含的基本数学问题;
[0009]步骤3:建立求解时变矩阵平方根问题的原始神经网络模型;
[0010]步骤4:定义非凸激活和噪声抑制的零化神经网络;
[0011]步骤5:利用非凸激活和噪声抑制的零化神经网络算法,在无噪声和有噪声的情况下对时变矩阵平方根问题的数学模型进行迭代求解,不断对系统残差以及状态变量进行映射及变换直至满足预定义的精度以及要求;
[0012]步骤6:最终得到输出模型系统和所得结果。
[0013]进一步的,步骤2中隐含的数学问题可以被统一表示为:
[0014]X2(t)

A(t)=0;
[0015]其中A(t),X(t)∈R
n
×
n
,其中X(t)是待求的未知矩阵,A(t)是已知动态矩阵。
[0016]进一步的,步骤3中建立求解时变矩阵平方根问题的数学模型具体表示为:
[0017]步骤3.1:建立时变矩阵平方根的误差函数,表示为:
[0018]E(t)=X2(t)

A(t);
[0019]步骤3.2:由OZNN模型的进化方向,我们可以得到:
[0020][0021]在这里κ>0;
[0022]步骤3.3:令x(t)=vec(X(t)),a(t)=vec(A(t)),
[0023]其中A(t)∈R
n
×
n
,x(t),由此我们可以得到求解时变矩阵平方根的零化神经网络模型,即OZNN模型为:
[0024][0025]进一步的,步骤4中提出的定义非凸激活和噪声抑制的零化神经网络具体表现为:
[0026]步骤4.1:非凸激活和噪声抑制的激活函数的定义为:
[0027](1)The power

sum projection function:
[0028]P
Λ
(E(t))=E(t)+E3(t)+E5(t);
[0029](2)The power

sigmoid projection function:
[0030][0031]其中参数μ1=3,μ2=1;
[0032](3)The bound projection function:
[0033][0034]其中其中同时ω的每一个子元素是ω
i
,其中i是1,2,3,
……

[0035](4)The ball projection function:
[0036][0037]其中Λ={ω∈R
n
×
n
,||ω||
F
≤Υ},其中Υ>0;
[0038](5)The nonconvex projection function:
[0039]Λ={ω∈R
n
×
n
,

b1≤ω
i
≤b1或ω
i
=b2或ω
i
=b3},其中b1,b2,b3是常数以及满足0<b1<b2和b3<

b1<0;
[0040](6)The centrosymmetric non

convex projection function:
[0041][0042]其中Λ={ω∈R
n
×
n
,p

≤ω
i
≤p
+
},在式子中常数参数0<q<1和p>0。
[0043]步骤4.2:定义一个基于误差的常系数神经网络:
[0044][0045]其中已知系数κ,ξ>0,而且满足
[0046]进一步的,步骤5中利用具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根具体表示为:
[0047]步骤5.1:求解时变矩阵平方根的非凸激活和噪声抑制的零化神经网络求解时变矩阵平方根的模型:
[0048][本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根,其特征在于,包括以下步骤:步骤1:输入原始实际问题;步骤2:根据输入的原始实际问题,抽象与建模得到其中的隐含的基本数学问题;步骤3:建立求解时变矩阵平方根的原始神经网络模型;步骤4:定义非凸激活和噪声抑制零化神经网络;步骤5:利用非凸激活和噪声抑制零化神经网络算法,在无噪声和有噪声的情况下对时变矩阵平方根的数学模型进行迭代求解,不断对系统残差以及状态变量进行映射及变换直至满足预定义的精度以及要求;步骤6:最终得到输出模型系统和所得结果。2.根据权利要求1所述的具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根,其特征在于,步骤1中的原始实际问题为机械臂移动规划、图像处理问题。3.根据权利要求1所述的具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根,其特征在于,步骤2中隐含的数学问题统一表示为:X2(t)

A(t)=0;其中A(t),X(t)∈R
n
×
n
,其中X(t)是待求的未知矩阵,A(t)是已知动态矩阵。4.根据权利要求1所述的具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根,其特征在于,步骤3中建立求解时变矩阵平方根的数学模型具体表示为:步骤3.1:建立时变矩阵平方根的误差函数,表示为:E(t)=X2(t)

A(t);步骤3.2:由OZNN模型的进化方向得到:其中,κ>0;步骤3.3:令x(t)=vec(X(t)),a(t)=vec(A(t)),其中A(t)∈R
n
×
n
,由此得到求解时变矩阵平方根的零化神经网络模型,即OZNN模型为:5.根据权利要求1所述的具有非凸激活函数的噪声抑制零化神经网络求解时变矩阵平方根,其特征在于,步骤4中定义非凸激活和噪声抑制零化神经网络具体表现为,步骤4.1:建立非凸激活和噪声抑制的激活函数,定义为:(1)The power

sum projection function:P
Λ
(E(t))=E(t)+E3(t)+E5(t);(2)The power

sigmoid projection function:其中参数μ1=3,μ2=1;
(3)The bound projection function:其中其中同时ω的每一个子元素是ω
i
,其中i是1,2...

【专利技术属性】
技术研发人员:郑棉杰姜丞泽肖秀春
申请(专利权)人:广东海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1