【技术实现步骤摘要】
模型训练方法、数据处理方法及装置
[0001]本申请涉及人工智能领域,尤其涉及一种模型训练方法、数据处理方法及装置。
技术介绍
[0002]大规模多输入多输出(Massive Multi
‑
Input Multi
‑
Output,Massive MIMO)是第五代移动通信技术(5th Generation Mobile Communication Technology,5G)无线通信网络的一种关键技术,已经在5G中广泛使用。通过Massive MIMO一方面可以同时为多个用户设备(User Equipment,UE)服务,另一方面,每个UE可以配置更多的天线,因此可以在频谱资源受限的情况下增大信道的容量。在Massive MIMO系统中,为了实现同时为多UE、多天线服务,需要将UE的信道状态信息(Channel State Information,CSI)反馈给基站(Base Station,BS),但是,CSI是一个维度为天线数*频带数的复数矩阵,反馈该矩阵的开销很大。
[000 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述模型包括编码网络和解码网络,所述方法包括:获取第一训练集,所述第一训练集中包括多个第一稀疏矩阵,每个第一稀疏矩阵表示一个角度域和时延域的信道状态信息;针对任意一个第一稀疏矩阵:将所述第一稀疏矩阵输入所述编码网络,输出第一均值矩阵和第一尺度矩阵;根据所述第一均值矩阵和所述第一尺度矩阵,构建第一量化矩阵;将所述第一量化矩阵输入所述解码网络,输出第一估计矩阵和第一指示矩阵;根据所述第一均值矩阵和所述第一尺度矩阵,确定第一损失;根据所述第一估计矩阵和所述第一指示矩阵,确定第二损失;基于所述第一损失和所述第二损失调整所述编码网络的参数以及所述解码网络的参数,调整后的所述编码网络用于对信道在角度域和时延域的信道状态信息进行编码,调整后的所述解码网络用于解码得到信道在角度域和时延域的信道状态信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一均值矩阵和所述第一尺度矩阵,确定第一损失,包括:基于所述第一均值矩阵和所述第一尺度矩阵,生成第一稀疏分布;获取所述第一稀疏分布对应的第一标准分布,所述第一稀疏分布与所述第一标准分布对应的分布类型相同,且所述第一标准分布的均值为第一均值、尺度为第一尺度;将所述第一稀疏分布和所述第一标准分布之间的KL散度,确定为所述第一损失。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一均值矩阵和所述第一尺度矩阵,构建第一量化矩阵包括:在所述第一标准分布中进行采样,得到第一采样矩阵;基于所述第一均值矩阵、所述第一尺度矩阵和所述第一采样矩阵,生成第一隐层特征矩阵;在第一阈值范围内的均匀分布中进行采样,得到第二采样矩阵;根据所述第一隐层特征矩阵和所述第二采样矩阵,生成所述第一量化矩阵。4.根据权利要求1所述的方法,其特征在于,所述根据第一估计矩阵和所述第一指示矩阵,确定第二损失,包括:根据所述第一稀疏矩阵、所述第一估计矩阵,生成第二稀疏分布;获取所述第二稀疏分布对应的第二标准分布,所述第二稀疏分布与所述第二标准分布对应的分布类型以及尺度相同,且所述第二标准分布的均值为第二均值;根据所述第二稀疏分布、所述第二标准分布以及所述第一指示矩阵,确定伯努利分布;根据所述伯努利分布,确定所述第二损失。5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述获取第一训练集包括:获取多个第一原始矩阵,每个第一原始矩阵表示一个空域和频域的信道状态信息;针对任意一个第一原始矩阵,对所述第一原始矩阵进行二维离散傅里叶变换,并删除变换结果中所有元素取值均为零的行,得到所述第一稀疏矩阵。6.一种数据处理方法,其特征在于,所述方法应用于第一装置,所述方法包括:获取第二稀疏矩阵,所述第二稀疏矩阵表示第一信道在角度域和时延域的信道状态信
息,所述第一信道表示所述第一装置与第二装置之间的信道;将所述第二稀疏矩阵输入编码网络,输出第二均值矩阵和第二尺度矩阵,所述编码网络为通过权利要求1至5中任意一项所述的模型训练方法进行训练后得到的编码网络;根据所述第二均值矩阵和所述第二尺度矩阵,构建第二量化矩阵;对所述第二量化矩阵进行熵编码,生成第一比特流;向所述第二装置发送所述第一比特流。7.根据权利要求6所述的方法,其特征在于,所述获取第二稀疏矩阵包括:获取第二原始矩阵,所述第二原始矩阵表示所述第一信道在空域和频域的信道状态信息;对所述第二原始矩阵进行二维离散傅里叶变换,并删除变换结果中所有元素取值均为零的行,得到所述第二稀疏矩阵。8.根据权利要求6所述的方法,其特征在于,所述根据所述第二均值矩阵和所述第二尺度矩阵,构建第二量化矩阵,包括:在第一分布类型的标准分布中进行采样,得到第三采样矩阵,所述第一分布类型表示确定所述第一损失过程中使用的第一标准分布的分布类型;基于所述第二均值矩阵、所述第二尺度矩阵和所述第三采样矩阵,生成第二隐层特征矩阵;对所述第二隐层特征矩阵进行均匀量化,得到所述第二量化矩阵。9.一种数据处理方法,其特征在于,所述方法应用于第二装置,所述方法包括:接收来自第一装置的第一比特流;对所述第一比特流进行逆向熵编码,得到第三量化矩阵;将所述第三量化矩阵输入解码网络,输出第二估计矩阵和第二指示矩阵,所述解码网络为通过权利要求1至5中任意一项所述的模型训练方法进行训练后得到的解码网络;对所述第二指示矩阵进行逐元素二值化处理,并根据处理结果与所述第二估计矩阵,生成第一重构矩阵,所述第一重构矩阵表示第一信道在角度域和时延域的信道状态信息,所述第一信道表示所述第一装置与第二装置之间的信道;对所述第一重构矩阵进行补零操作,并对操作结果进行二维逆向离散傅里叶变换,得到第二重构矩阵,所述第二重构矩阵表示所述第一信道在空域和频域的信道状态信息。10.一种模型训练装置,其特征在于,所述模型包括编码网络和解码网络,所述装置包括:第一获取模块,用于获取第一训练集,所述第一训练集中包括多个第一稀疏矩阵,每个第一稀疏矩阵表示一个角度域和时延域的信道状态信息;第一输入模块,用于将所述第一稀疏矩阵输入所述编码网络,输出第一均值矩阵和第一尺度矩阵;第一构建模块,用于根据所述第一均值矩阵和所述第一尺度矩阵,构建第一量化矩阵;第二输入模块,用于将所述第一量化矩阵输入所述解码网络,输出第一估计矩阵和第一指示矩阵...
【专利技术属性】
技术研发人员:张文凯,程敏,陈志堂,陈家璇,郑轩宇,郭化盐,毕媛媛,刘坚能,
申请(专利权)人:香港科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。