一种自动混合精度量化方法及装置制造方法及图纸

技术编号：34536643 阅读：29 留言：0更新日期：2022-08-13 21:31

本发明专利技术提供一种自动混合精度量化方法及装置，其中，所述方法包括：获取多输入多输出MIMO检测器在对MIMO系统进行信号检测的过程中产生的待量化的中间变量；通过深度强化学习算法对智能体进行训练，并基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化；基于概率密度函数，对每个所述中间变量的整数位宽进行量化。本发明专利技术可以自动实现MIMO检测器中不同中间变量的量化位宽的分配，避免了大量的量化位宽冗余，节省硬件资源。源。源。

全部详细技术资料下载

【技术实现步骤摘要】
一种自动混合精度量化方法及装置

[0001]本专利技术涉及机器学习
，尤其涉及一种自动混合精度量化方法及装置。

技术介绍

[0002]随着对通信系统的吞吐率和稳定性的需求不断增加，多输入多输出(MIMO，multiple
‑
input multiple
‑
output)系统由于其高频谱效率的潜力而受到广泛关注。由于大规模MIMO场景中最优检测算法的计算复杂度在硬件实现中难以承受，目前许多硬件友好型检测器已经实现并且在吞吐率、能量效率和面积效率方面呈现出明显的优势。但是，现有的硬件友好型检测器主要关注的是算术实现而不是量化优化，且为了节省设计工作量，大多采用对所有变量使用相同量化位宽的统一量化方案，导致大量的量化位宽冗余，造成硬件资源浪费。

技术实现思路

[0003]本专利技术提供一种自动混合精度量化方法及装置，用以解决现有技术中MIMO检测器对所有变量使用相同的量化方案导致的大量的量化位宽冗余，造成硬件资源浪费的缺陷，可以自动实现MIMO检测器中不同中间变量的量化位宽的分配，避免了大量的量化位宽冗余，节省硬件资源。
[0004]本专利技术提供一种自动混合精度量化方法，包括：
[0005]获取MIMO检测器在对MIMO系统进行信号检测的过程中产生的待量化的中间变量；
[0006]通过深度强化学习算法对智能体进行训练，并基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化；
[0007]对每个所述中间变量的整数位宽...

【技术保护点】

【技术特征摘要】
1.一种自动混合精度量化方法，其特征在于，包括：获取多输入多输出MIMO检测器在对MIMO系统进行信号检测的过程中产生的待量化的中间变量；通过深度强化学习算法对智能体进行训练，并基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化；对每个所述中间变量的整数位宽进行量化。2.根据权利要求1所述的面向MIMO检测器的自动混合精度量化方法，其特征在于，所述通过深度强化学习算法对智能体进行训练，包括：在每一回合中，初始化环境，基于马尔可夫决策过程将智能体与环境进行交互，并存储交互数据；每达到预设回合次数，控制所述智能体基于当前存储的所述交互数据更新所述智能体中存储的策略，直至达到最大回合次数。3.根据权利要求2所述的面向MIMO检测器的自动混合精度量化方法，其特征在于，所述初始化环境，包括：随机抽取多个中间变量；初始化所有中间变量的小数位宽为预设的最大小数位宽，初始化所有中间变量的整数位宽为预设的最大整数位宽；确定多个状态，所述多个状态包括所述多个中间变量对应的序号和小数位宽；从所述多个状态中随机选择并返回一个状态。4.根据权利要求3所述的面向MIMO检测器的自动混合精度量化方法，其特征在于，所述基于马尔可夫决策过程将智能体与环境进行交互，并存储交互数据，包括：在每个时刻执行以下步骤，直至当前时刻达到最大时刻，并存储每个时刻产生的交互数据，所述交互数据包括状态、动作值和奖励值：根据当前状态和当前策略确定动作值；其中，所述动作值用于表征小数位宽的变化量；根据所述动作值修改当前量化方案，得到修改后的量化方案；根据奖励函数对所述修改后的量化方案进行评估，得到奖励值，同时选择并返回下一状态。5.根据权利要求1
‑
4任一项所述的面向MIMO检测器的自动混合精度量化方法，其特征在于，所述基于训练好的所述智能体中存储的策略对每个所述中间变量的小数位宽进行量化，包括：通过蒙特卡罗仿真算法将训练好的所述智能体中存储的策略转化为每个所述中间变量的小数位宽的统计分布；基于所述中间变量的小数位宽的统计分布，对所述中间变量的小数位宽进行量化；其中，所述策略用于表征状态和动作值之间的映射关系，所述状态包括中间变量对应的序号和小数位宽，所述动作值用于表征小数位宽的变化量。6.根据权利要求5所述的面...

【专利技术属性】
技术研发人员：张川，葛荧萌，冀贞昊，张在琛，黄永明，尤肖虎，
申请(专利权)人：网络通信与安全紫金山实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人