【技术实现步骤摘要】
量化的方法、装置、设备及可读存储介质
[0001]本申请属于通信
,具体涉及一种人工智能(Artificial Intelligence,AI)模块量化的方法、装置、设备及可读存储介质。
技术介绍
[0002]人工智能目前在各个领域获得了广泛的应用。在通信网络中,可以通过AI模块实现人工智能。然而,目前尚无对AI模块量化的流程,造成AI模块的复杂度提升。
技术实现思路
[0003]本申请实施例提供一种量化的方法、装置、设备及可读存储介质,解决如何降低AI模块的复杂度的问题。
[0004]第一方面,提供一种量化的方法,由第一通信设备执行,包括:
[0005]确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数,所述第一模块为人工智能AI模块;
[0006]根据所述量化策略、量化等级和/或量化配置参数,对所述第一模块的参数进行量化处理。
[0007]第二方面,提供一种量化的装置,应用于第一通信设备,包括:
[0008]第一确定模块,用于确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数,所述第一模块为AI模块;
[0009]量化模块,用于根据所述量化策略、量化等级和/或量化配置参数,对所述第一模块的参数进行量化处理。
[0010]第三方面,提供一种通信设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的方法的步骤。
[0011]第四方 ...
【技术保护点】
【技术特征摘要】
1.一种量化的方法,其特征在于,由第一通信设备执行,包括:确定所述第一通信设备的第一模块的量化策略、量化等级和/或量化配置参数,所述第一模块为人工智能AI模块;根据所述量化策略、量化等级和/或量化配置参数,对所述第一模块的参数进行量化处理。2.根据权利要求1所述的方法,其特征在于,所述量化策略包括以下一项或多项:直接量化法;均匀量化法;非均匀量化法;权值共享量化法;分组量化法;变换域量化法;参数编码量化法;乘积量化法。3.根据权利要求1所述的方法,其特征在于,所述根据所述量化策略、量化等级和/或量化配置参数,对所述第一模块的参数进行量化处理的步骤包括:在网络训练阶段,根据所述量化策略、量化等级和/或量化配置参数,对所述第一模块的参数进行量化处理。4.根据权利要求2所述的方法,其特征在于,所述分组量化法中的参数划分方式包括:随机划分方式;根据所述参数的标识确定所述参数所在的集合标识;聚类划分方式。5.根据权利要求4所述的方法,其特征在于,所述根据所述参数的标识确定所述参数所在的集合标识,包括:根据所述参数的标识,得到第一数值;根据所述第一数值,确定所述参数所在的集合标识;其中,根据所述第一数值,确定所述参数所在的集合标识包括以下一项或多项:将所述第一数值取整,得到所述参数所在的集合标识;从所述第一数值中取其中至少一位,组合为所述参数所在的集合标识;将所述第一数值除以预设值,将得到的余数作为所述参数所在的集合标识。6.根据权利要求1所述的方法,其特征在于,所述量化策略和/或量化配置参数根据以下一项或多项确定:终端上报;终端的能力;网络侧配置。7.根据权利要求2所述的方法,其特征在于,所述量化策略为直接量化法,所述根据所述量化策略、量化等级和/或量化配置参数,对所述第一模块的参数进行量化处理的步骤包括:根据所述第一模块的量化等级和/或量化配置参数,对所述第一模块的参数进行量化
处理。8.根据权利要求1所述的方法,其特征在于,所述量化等级根据以下一项或多项确定:所述第一模块的参数的相关信息;终端上报;终端的能力;网络侧配置;所述第一模块的输出精度要求;所述第一模块的性能要求。9.根据权利要求8所述的方法,其特征在于,所述第一模块的参数的相关信息包括:所述参数的大小;其中,所述参数越大,所述量化等级越高;或者,所述参数越大,所述量化等级越低。10.根据权利要求1所述的方法,其特征在于,所述量化等级越高,所述第一模块的参数量化的精确度越精确,或者,所述量化等级越低,所述第一模块的参数量化的精确度越粗糙。11.根据权利要求1所述的方法,其特征在于,所述第一模块的类型为神经网络;其中,所述神经网络中的不同层的神经元的量化等级相同;和/或,所述神经网络中的同一层的神经元的量化等级相同;和/或,所述神经网络中的乘性系数的量...
【专利技术属性】
技术研发人员:杨昂,
申请(专利权)人:维沃移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。