一种隐式三元组神经网络及光纤非线性损伤均衡方法技术

技术编号:26307516 阅读:60 留言:0更新日期:2020-11-10 20:08
本发明专利技术涉及一种隐式三元组神经网络及光纤非线性损伤均衡方法,属于光纤通信及均衡技术领域.包括隐式三元组神经网络及基于该网络的光纤非线性损伤均衡方法。所述方法:1)生成训练集、验证集以及测试集,具体为:生成二进制比特流、生成标签符号流、获取待处理符号流并生成样本及划分数据集2)优化隐式三元组神经网络,得到最优隐式三元组神经网络;初始化超参数搜索流程、初始化可调参数迭代流程、计算损失函数及所有可调参数的梯度并更新可调参数、迭代并评估优化结果,选取最优隐式三元组神经网络;3)测试隐式三元组神经网络,得到均衡后信号。所述神经网络及方法与现有技术相比计算代价更低,能进一步提升均衡效果。

【技术实现步骤摘要】
一种隐式三元组神经网络及光纤非线性损伤均衡方法
本专利技术涉及一种隐式三元组神经网络及光纤非线性损伤均衡方法,属于光纤通信及均衡

技术介绍
光纤通信系统的容量会受到光纤线性损伤和非线性损伤的限制。随着光纤通信技术的发展,光纤通信系统的通信容量已接近线性区的香农极限。进一步提升光纤通信系统的通信容量需要突破光纤非线性损伤的限制。典型的光纤非线性补偿方法除了链路光补偿类方法,还包括数字信号处理类的补偿方法。数字信号处理类的补偿方法包括数字反向传播(DBP,digitalback-propagation),基于Volterra级数传递函数的方法(VSTF,Volterratransferfunction),基于微扰理论的方法和基于机器学习的方法。DBP和VSTF能有效缓解信号中的光纤非线性损伤。但是,由于其递归性,DBP和VSTF需要的难以接受的计算复杂度。基于微扰理论的方法虽然不需要递归,但是在信号累积了较大色散的情况下需要计算一个大规模的系数矩阵,同样需要难以接受的计算复杂度。基于机器学习的方法中,神经网络是一种有潜力的光纤非线性均衡方法。神经网络通过拟合训练数据来估计一个光纤的逆传输系统来达到均衡光纤非线性损伤的目的。使用神经网络进行光纤非线性均衡不需要递归,需要更低的计算复杂度。并且,由于其自适应特性,神经网络有可能比非机器学习类的方法性能更佳。但是神经网络的设计并未考虑任何专家知识,这使神经网络的训练需要大量的训练数据,加重了均衡的代价。作为引入专家知识的尝试,使用信号构成三元组作为输入能够提升神经网络的均衡效果。但是,计算三元组同样需要较大的计算量。
技术实现思路
本专利技术的目的在于针对现有光纤非线性损伤均衡方法存在需要训练数据多以及复杂度较高的技术缺陷,提出了一种隐式三元组神经网络及光纤非线性损伤均衡方法。本专利技术是通过以下技术方案实现的:所述隐式三元组神经网络及光纤非线性损伤均衡方法,包括用于光纤非线性损伤均衡的隐式三元组神经网络以及基于该隐式三元组神经网络的光纤非线性损伤均衡方法。所述隐式三元组神经网络由下式定义:其中,下标x/y代表x偏振态或y偏振态;为x或y偏振态的第k个符号的均衡结果;rx/y,k为x或y偏振态第k个接收到的符号;*代表取共轭操作;βs为第s个锚权重;gs为第s个隐式三元组核函数;M称为锚点数,且锚点数M均大于或等于1;(rx/y,k,ry/x,k)中,当前者rx/y,k为x偏振态即rx,k,则后者ry/x,k为y偏振态ry,k;rx/y,k或ry/x,k为由第k个接收到的符号相邻若干个符号构成的信息向量,具体为:其中,D为时间窗口,且为奇数;时间窗口D均大于或等于1,上标T代表转置;第s个隐式三元组核函数定义为:gs(rx/y,k,ry/x,k)=Px/y,s,k(|Px/y,s,k|2+|Py/x,s,k|2)(2)其中,即:其中,H为共轭转置操作;αs称为第s个隐式三元组核函数的参数矢量;所有隐式三元组核函数的参数矢量和锚权重称为可调参数;所述基于该隐式三元组神经网络的光纤非线性损伤均衡方法,包括以下步骤:步骤一,生成数据集;其中,数据集包括训练集、验证集以及测试集;步骤一,具体包括如下子步骤:步骤1.1生成二进制比特流,即随机生成在x偏振态传输的二进制比特流bx和在y偏振态传输的二进制比特流by;其中,二进制比特流bx和by中只包含比特0和比特1;其中,比特0和比特1的出现概率均为50%;步骤1.2生成标签符号流,具体为:将步骤1.1生成的bx和by经映射表f分别映射到星座图上,得到在x偏振态传输的标签符号流sx和在y偏振态传输的标签符号流sy;其中,映射表f由调制格式确定;步骤1.3获取待处理符号流,生成样本,具体为:步骤1.2生成的标签符号流sx和sy经过光纤通信系统的传输,并经过前置均衡后,得到对应的x偏振态的待处理符号流rx和y偏振态的待处理符号流ry;其中,前置均衡包括线性均衡或非自适应的光纤非线性损伤均衡;一个待处理符号及其对应的标签符号的组合称为样本;步骤1.4数据集划分,具体为:按照一定比例随机将样本划分为三份,分别作为训练集、验证集以及测试集;步骤二,优化隐式三元组神经网络,得到最优隐式三元组神经网络;具体包括如下子步骤:步骤2.1初始化超参数搜索流程,即设置超参数候选集、最大迭代次数、最小优化量、最大忍耐步数、损失函数、梯度优化函数、批处理大小以及分配缓存;其中,缓存包括损失缓存、超参数缓存、可调参数缓存以及验证结果缓存;其中,损失缓存初始值为0;其中,超参数包括时间窗口D、锚点数M以及学习率η;其中,一组超参数配置,包括时间窗口、锚点数和学习率,记为(D,M,η),所有待选的超参数配置组成超参数候选集;其中,损失函数J由下式(4)定义:其中,N为批处理大小,大于或等于1;ai为本网络的第i个输出符号;si为标签符号流中与ai对应的标签符号;其中,梯度优化函数为以损失函数关于可调参数的梯度为自变量的函数,记为u(gradθ);其中,gradθ为损失函数关于可调参数θ的梯度,θ为锚权重或隐式三元组核函数的权重矢量的某一分量,梯度优化函数为有记忆的或无记忆的有界函数;其中,可调参数,包括所有隐式三元组核函数的参数矢量和锚权重;其中,最大迭代次数记为itermax,最小优化量记为Imin,迭代次数记为iter;其中,最小优化量Imin大于0;步骤2.2初始化可调参数迭代流程,具体为:初始化迭代次数iter为0,忍耐步数为0,损失缓存为0;从超参数候选集中选取一组超参数配置并应用,并从超参数候选集中剔除所选超参数配置;步骤2.3计算损失函数,具体为:从训练集中随机抽取与批处理大小N相同数量的样本送入本网络,得到N个均衡符号,通过式(4)计算损失,并计算优化量I,最后将本次计算出的损失存入损失缓存;其中,优化量I为损失缓存减去损失;步骤2.4计算步骤2.3中损失函数关于所有可调参数的梯度;其中,梯度为沃廷格梯度;步骤2.5更新可调参数θ并将iter加1,具体通过更新公式(5)实现:θ←θ-ηu(gradθ)(5)其中,θ为需更新的可调参数;步骤2.6判断可调参数迭代是否终止,具体为:2.6A若iter等于itermax,则跳到步骤2.7;2.6B若iter小于itermax,则进一步判断,具体为:2.6BA若Imin小于或等于I,则跳到步骤2.3;2.6BB若Imin大于I,则忍耐步数加1,并跳到步骤2.6C;步骤2.6C由忍耐步数判断是否终止可调参数迭代,具体为:步骤2.6CA若忍耐步数等于最大忍耐步数,则跳到步骤2.7;步骤2.6C本文档来自技高网
...

【技术保护点】
1.光纤非线性损伤均衡的隐式三元组神经网络,其特征在于:由下式定义:/n

【技术特征摘要】
1.光纤非线性损伤均衡的隐式三元组神经网络,其特征在于:由下式定义:



其中,下标x/y代表x偏振态或y偏振态;为x或y偏振态的第k个符号的均衡结果;rx/y,k为x或y偏振态第k个接收到的符号;*代表取共轭操作;βs为第s个锚权重;gs为第s个隐式三元组核函数;M称为锚点数,且锚点数M均大于或等于1;(rx/y,k,ry/x,k)中,当前者rx/y,k为x偏振态即rx,k,则后者ry/x,k为y偏振态ry,k;rx/y,k或ry/x,k为由第k个接收到的符号相邻若干个符号构成的信息向量,具体为:






其中,D为时间窗口,且为奇数;时间窗口D均大于或等于1,上标T代表转置;
第s个隐式三元组核函数定义为:
gs(rx/y,k,ry/x,k)=Px/y,s,k(|Px/y,s,k|2+|Py/x,s,k|2)(2)
其中,即:
其中,H为共轭转置操作;αs称为第s个隐式三元组核函数的参数矢量;所有隐式三元组核函数的参数矢量和锚权重称为可调参数。


2.权利要求1所述的隐式三元组神经网络依托的光纤非线性损伤均衡方法,其特征在于:包括以下步骤:
步骤一,生成数据集;
其中,数据集包括训练集、验证集以及测试集;
步骤二,优化隐式三元组神经网络,得到最优隐式三元组神经网络;具体包括如下子步骤:
步骤2.1初始化超参数搜索流程,即设置超参数候选集、最大迭代次数、最小优化量、最大忍耐步数、损失函数、梯度优化函数、批处理大小以及分配缓存;
其中,缓存包括损失缓存、超参数缓存、可调参数缓存以及验证结果缓存;
其中,损失缓存初始值为0;
其中,超参数包括时间窗口D、锚点数M以及学习率η;
其中,一组超参数配置,包括时间窗口、锚点数和学习率,记为(D,M,η),所有待选的超参数配置组成超参数候选集;
其中,损失函数J由下式(4)定义:



其中,N为批处理大小,大于或等于1;ai为本网络的第i个输出符号;si为标签符号流中与ai对应的标签符号;
其中,梯度优化函数为以损失函数关于可调参数的梯度为自变量的函数,记为u(gradθ);
其中,gradθ为损失函数关于可调参数θ的梯度,θ为锚权重或隐式三元组核函数的权重矢量的某一分量,梯度优化函数为有记忆的或无记忆的有界函数;
其中,可调参数,包括所有隐式三元组核函数的参数矢量和锚权重;
其中,最大迭代次数记为itermax,最小优化量记为Imin,迭代次数记为iter;
其中,最小优化量Imin大于0;
步骤2.2初始化可调参数迭代流程,具体为:初始化迭代次数iter为0,忍耐步数为0,损失缓存为0;从超参数候选集中选取一组超参数配置并应用,并从超参数候选集中剔除所选超参数配置;
步骤2.3计算损失函数,具体为:从训练集中随机抽取与批处理大小N相同数量的样本送入本网络,得到N个均衡符号,通过式(4)计算损失,并计算优化量I,最后将本次计算出的损失存入损失缓存;其中,优化量I为损失缓存减去损失;
步骤2.4计算步骤2.3中损失函数关于所有可调参数的梯度;
其中,梯度...

【专利技术属性】
技术研发人员:杨爱英何品靖郭芃冯立辉忻向军
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1