量化的方法、装置、设备及可读存储介质制造方法及图纸

技术编号：34872050 阅读：17 留言：0更新日期：2022-09-10 13:24

本申请公开了一种量化的方法、装置、设备及可读存储介质，该方法包括：确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为AI模块；根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。在本申请实施例中，通过量化策略、量化等级和/或量化配置参数对AI模块进行量化处理，从而可以降低AI模块的复杂度，提升系统性能。提升系统性能。提升系统性能。

全部详细技术资料下载

【技术实现步骤摘要】
量化的方法、装置、设备及可读存储介质

[0001]本申请属于通信
，具体涉及一种人工智能(Artificial Intelligence，AI)模块量化的方法、装置、设备及可读存储介质。

技术介绍

[0002]人工智能目前在各个领域获得了广泛的应用。在通信网络中，可以通过AI模块实现人工智能。然而，目前尚无对AI模块量化的流程，造成AI模块的复杂度提升。

技术实现思路

[0003]本申请实施例提供一种量化的方法、装置、设备及可读存储介质，解决如何降低AI模块的复杂度的问题。
[0004]第一方面，提供一种量化的方法，由第一通信设备执行，包括：
[0005]确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为人工智能AI模块；
[0006]根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。
[0007]第二方面，提供一种量化的装置，应用于第一通信设备，包括：
[0008]第一确定模块，用于确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为AI模块；
[0009]量化模块，用于根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。
[0010]第三方面，提供一种通信设备，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序，所述程序被所述处理器执行时实现如第一方面所述的方法的步骤。
[0011]第四方...

【技术保护点】

【技术特征摘要】
1.一种量化的方法，其特征在于，由第一通信设备执行，包括：确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数，所述第一模块为人工智能AI模块；根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。2.根据权利要求1所述的方法，其特征在于，所述量化策略包括以下一项或多项：直接量化法；均匀量化法；非均匀量化法；权值共享量化法；分组量化法；变换域量化法；参数编码量化法；乘积量化法。3.根据权利要求1所述的方法，其特征在于，所述根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理的步骤包括：在网络训练阶段，根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理。4.根据权利要求2所述的方法，其特征在于，所述分组量化法中的参数划分方式包括：随机划分方式；根据所述参数的标识确定所述参数所在的集合标识；聚类划分方式。5.根据权利要求4所述的方法，其特征在于，所述根据所述参数的标识确定所述参数所在的集合标识，包括：根据所述参数的标识，得到第一数值；根据所述第一数值，确定所述参数所在的集合标识；其中，根据所述第一数值，确定所述参数所在的集合标识包括以下一项或多项：将所述第一数值取整，得到所述参数所在的集合标识；从所述第一数值中取其中至少一位，组合为所述参数所在的集合标识；将所述第一数值除以预设值，将得到的余数作为所述参数所在的集合标识。6.根据权利要求1所述的方法，其特征在于，所述量化策略和/或量化配置参数根据以下一项或多项确定：终端上报；终端的能力；网络侧配置。7.根据权利要求2所述的方法，其特征在于，所述量化策略为直接量化法，所述根据所述量化策略、量化等级和/或量化配置参数，对所述第一模块的参数进行量化处理的步骤包括：根据所述第一模块的量化等级和/或量化配置参数，对所述第一模块的参数进行量化
处理。8.根据权利要求1所述的方法，其特征在于，所述量化等级根据以下一项或多项确定：所述第一模块的参数的相关信息；终端上报；终端的能力；网络侧配置；所述第一模块的输出精度要求；所述第一模块的性能要求。9.根据权利要求8所述的方法，其特征在于，所述第一模块的参数的相关信息包括：所述参数的大小；其中，所述参数越大，所述量化等级越高；或者，所述参数越大，所述量化等级越低。10.根据权利要求1所述的方法，其特征在于，所述量化等级越高，所述第一模块的参数量化的精确度越精确，或者，所述量化等级越低，所述第一模块的参数量化的精确度越粗糙。11.根据权利要求1所述的方法，其特征在于，所述第一模块的类型为神经网络；其中，所述神经网络中的不同层的神经元的量化等级相同；和/或，所述神经网络中的同一层的神经元的量化等级相同；和/或，所述神经网络中的乘性系数的量...

【专利技术属性】
技术研发人员：杨昂，
申请(专利权)人：维沃移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人