一种自动混合精度量化方法及装置制造方法及图纸

技术编号:34536643 阅读:29 留言:0更新日期:2022-08-13 21:31
本发明专利技术提供一种自动混合精度量化方法及装置,其中,所述方法包括:获取多输入多输出MIMO检测器在对MIMO系统进行信号检测的过程中产生的待量化的中间变量;通过深度强化学习算法对智能体进行训练,并基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化;基于概率密度函数,对每个所述中间变量的整数位宽进行量化。本发明专利技术可以自动实现MIMO检测器中不同中间变量的量化位宽的分配,避免了大量的量化位宽冗余,节省硬件资源。源。源。

【技术实现步骤摘要】
一种自动混合精度量化方法及装置


[0001]本专利技术涉及机器学习
,尤其涉及一种自动混合精度量化方法及装置。

技术介绍

[0002]随着对通信系统的吞吐率和稳定性的需求不断增加,多输入多输出(MIMO,multiple

input multiple

output)系统由于其高频谱效率的潜力而受到广泛关注。由于大规模MIMO场景中最优检测算法的计算复杂度在硬件实现中难以承受,目前许多硬件友好型检测器已经实现并且在吞吐率、能量效率和面积效率方面呈现出明显的优势。但是,现有的硬件友好型检测器主要关注的是算术实现而不是量化优化,且为了节省设计工作量,大多采用对所有变量使用相同量化位宽的统一量化方案,导致大量的量化位宽冗余,造成硬件资源浪费。

技术实现思路

[0003]本专利技术提供一种自动混合精度量化方法及装置,用以解决现有技术中MIMO检测器对所有变量使用相同的量化方案导致的大量的量化位宽冗余,造成硬件资源浪费的缺陷,可以自动实现MIMO检测器中不同中间变量的量化位宽的分配,避免了大量的量化位宽冗余,节省硬件资源。
[0004]本专利技术提供一种自动混合精度量化方法,包括:
[0005]获取MIMO检测器在对MIMO系统进行信号检测的过程中产生的待量化的中间变量;
[0006]通过深度强化学习算法对智能体进行训练,并基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化;
[0007]对每个所述中间变量的整数位宽进行量化。
[0008]根据本专利技术提供的一种自动混合精度量化方法,所述通过深度强化学习算法对智能体进行训练,包括:
[0009]在每一回合中,初始化环境,基于马尔可夫决策过程将智能体与环境进行交互,并存储交互数据;
[0010]每达到预设回合次数,控制所述智能体基于当前存储的所述交互数据更新所述智能体中存储的策略,直至达到最大回合次数。
[0011]根据本专利技术提供的一种自动混合精度量化方法,所述初始化环境,包括:
[0012]随机抽取多个中间变量;
[0013]初始化所有中间变量的小数位宽为预设的最大小数位宽,初始化所有中间变量的整数位宽为预设的最大整数位宽;
[0014]确定多个状态,所述多个状态包括所述多个中间变量对应的序号和小数位宽;
[0015]从所述多个状态中随机选择并返回一个状态。
[0016]根据本专利技术提供的一种自动混合精度量化方法,所述基于马尔可夫决策过程将智能体与环境进行交互,并存储交互数据,包括:
[0017]在每个时刻执行以下步骤,直至当前时刻达到最大时刻,并存储每个时刻产生的交互数据,所述交互数据包括状态、动作值和奖励值:
[0018]根据当前状态和当前策略确定动作值;其中,所述动作值用于表征小数位宽的变化量;
[0019]根据所述动作值修改当前量化方案,得到修改后的量化方案;
[0020]根据奖励函数对所述修改后的量化方案进行评估,得到奖励值,同时选择并返回下一状态。
[0021]根据本专利技术提供的一种自动混合精度量化方法,所述基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化,包括:
[0022]通过蒙特卡罗仿真算法将训练好的所述智能体中存储的策略转化为每个所述中间变量的小数位宽的统计分布;
[0023]基于所述中间变量的小数位宽的统计分布,对所述中间变量的小数位宽进行量化;
[0024]其中,所述策略用于表征状态和动作值之间的映射关系,所述状态包括中间变量对应的序号和小数位宽,所述动作值用于表征小数位宽的变化量。
[0025]根据本专利技术提供的一种自动混合精度量化方法,所述通过蒙特卡罗仿真算法将训练好的所述智能体中存储的策略转化为每个所述中间变量的小数位宽的统计分布,包括:
[0026]在每次测试时执行以下步骤,直至达到最大测试次数,获得每个所述中间变量取不同小数位宽的频次,从而获得每个所述中间变量的小数位宽的统计分布:
[0027]针对每个所述中间变量,基于所述中间变量的当前状态和训练好的所述智能体中存储的策略确定动作值;
[0028]基于所述动作值更改所述中间变量的小数位宽。
[0029]根据本专利技术提供的一种自动混合精度量化方法,所述基于所述中间变量的小数位宽的统计分布,对所述中间变量的小数位宽进行量化,包括:
[0030]基于所述中间变量的小数位宽的统计分布将所述中间变量的小数位宽的统计分布的均值确定为所述中间变量的小数位宽。
[0031]根据本专利技术提供的一种自动混合精度量化方法,所述对每个所述中间变量的整数位宽进行量化,包括:
[0032]通过蒙特卡罗仿真算法生成每个所述中间变量的若干数据,得到第一数据集;
[0033]提取所述第一数据集中不在量化方案幅值范围内的数据,获得第二数据集;其中,量化方案幅值为以2为底数、以整数位宽为自变量的表达式减去以2为底数、以负的小数位宽为自变量的表达式的差;
[0034]将满足预设条件的最小整数位宽确定为所述中间变量的整数位宽;其中,所述预设条件为:所述第二数据集中数据的数量与所述第一数据集中数据的数量的比值小于等于预设阈值。
[0035]本专利技术还提供一种自动混合精度量化装置,包括:
[0036]变量获取模块,用于获取MIMO检测器在对MIMO系统进行信号检测的过程中产生的待量化的中间变量;
[0037]第一量化模块,用于通过深度强化学习算法对智能体进行训练,并基于训练好的
所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化;
[0038]第二量化模块,用于基于概率密度函数,对每个所述中间变量的整数位宽进行量化。
[0039]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的自动混合精度量化方法。
[0040]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的自动混合精度量化方法。
[0041]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的自动混合精度量化方法。
[0042]本专利技术提供的一种自动混合精度量化方法及装置,通过深度强化学习算法对智能体进行训练,并基于训练好的智能体中存储的策略对每个待量化的中间变量的小数位宽进行量化,可以自动实现不同中间变量的小数位宽的分配;而后,对每个中间变量的整数位宽进行量化,可以自动实现不同中间变量的整数位宽的分配。因此,本专利技术可以自动实现MIMO检测器中不同中间变量的量化位宽的分配,避免了大量的量化位宽冗余,节省硬件资源。
附图说明
[0043]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动混合精度量化方法,其特征在于,包括:获取多输入多输出MIMO检测器在对MIMO系统进行信号检测的过程中产生的待量化的中间变量;通过深度强化学习算法对智能体进行训练,并基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化;对每个所述中间变量的整数位宽进行量化。2.根据权利要求1所述的面向MIMO检测器的自动混合精度量化方法,其特征在于,所述通过深度强化学习算法对智能体进行训练,包括:在每一回合中,初始化环境,基于马尔可夫决策过程将智能体与环境进行交互,并存储交互数据;每达到预设回合次数,控制所述智能体基于当前存储的所述交互数据更新所述智能体中存储的策略,直至达到最大回合次数。3.根据权利要求2所述的面向MIMO检测器的自动混合精度量化方法,其特征在于,所述初始化环境,包括:随机抽取多个中间变量;初始化所有中间变量的小数位宽为预设的最大小数位宽,初始化所有中间变量的整数位宽为预设的最大整数位宽;确定多个状态,所述多个状态包括所述多个中间变量对应的序号和小数位宽;从所述多个状态中随机选择并返回一个状态。4.根据权利要求3所述的面向MIMO检测器的自动混合精度量化方法,其特征在于,所述基于马尔可夫决策过程将智能体与环境进行交互,并存储交互数据,包括:在每个时刻执行以下步骤,直至当前时刻达到最大时刻,并存储每个时刻产生的交互数据,所述交互数据包括状态、动作值和奖励值:根据当前状态和当前策略确定动作值;其中,所述动作值用于表征小数位宽的变化量;根据所述动作值修改当前量化方案,得到修改后的量化方案;根据奖励函数对所述修改后的量化方案进行评估,得到奖励值,同时选择并返回下一状态。5.根据权利要求1

4任一项所述的面向MIMO检测器的自动混合精度量化方法,其特征在于,所述基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化,包括:通过蒙特卡罗仿真算法将训练好的所述智能体中存储的策略转化为每个所述中间变量的小数位宽的统计分布;基于所述中间变量的小数位宽的统计分布,对所述中间变量的小数位宽进行量化;其中,所述策略用于表征状态和动作值之间的映射关系,所述状态包括中间变量对应的序号和小数位宽,所述动作值用于表征小数位宽的变化量。6.根据权利要求5所述的面...

【专利技术属性】
技术研发人员:张川葛荧萌冀贞昊张在琛黄永明尤肖虎
申请(专利权)人:网络通信与安全紫金山实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1