可分割深度神经网络中的动态特征尺寸适配制造技术

技术编号：39179726 阅读：11 留言：0更新日期：2023-10-27 08:27

本发明专利技术提出了一种方法，该方法处理针对分布式AI的有效传输，其中规定了在多个带宽之间切换。在边缘设备处的分布式推断期间，每个设备仅需要加载AI模型的一部分一次，但是它们之间所传送的输入/输出特征可通过启用/禁用动态特征尺寸切换器(DySw)中的节点之间的连接而根据可用传输带宽来灵活地配置。当连接或断开一些节点以便实现所需的压缩因数时，DNN的其他参数保持相同。也就是说，将相同的DNN模型用于不同的压缩因数，并且不需要下载新的DNN模型以与压缩因数或网络带宽适配。模型以与压缩因数或网络带宽适配。模型以与压缩因数或网络带宽适配。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】可分割深度神经网络中的动态特征尺寸适配

[0001]本专利技术实施方案整体上涉及可分割深度神经网络(DNN)中的动态特征尺寸适配。

技术介绍

[0002]人工智能是当今许多
的重要功能区块。这是由于呈深度神经网络(DNN)形式的神经网络的再次兴起。现代DNN通常为计算密集型的，因此，在处理能力低下的移动电话或其他边缘设备上执行DNN操作很有挑战性。这通常通过将数据从移动设备传输到云服务器来解决，在云服务器中完成所有计算。

技术实现思路

[0003]根据一个实施方案，提出了一种设备，该设备包括无线发射/接收单元(WTRU)，该WTRU包括：接收器，其被配置为接收深度神经网络(DNN)模型的一部分，其中所述部分在所述DNN模型的分割点之前，并且其中所述DNN模型的所述部分包括用以在所述DNN模型的所述分割点处压缩特征的神经网络；一个或多个处理器，其被配置为：获得所述神经网络的压缩因数；响应于所述压缩因数，确定将连接所述神经网络中的哪些节点；响应于所述确定，配置所述神经网络；以及利用所述DNN模型的所述部分来执行推断，以生成压缩特征；以及发射器，其被配置为向另一WTRU发射所述压缩特征。
[0004]根据另一实施方案，提出了一种设备，该设备包括无线发射/接收单元(WTRU)，该WTRU包括：接收器，其被配置为接收深度神经网络(DNN)模型的一部分，其中所述部分在所述DNN模型的分割点之后，并且其中所述DNN模型的所述部分包括用以在所述DNN模型的所述分割点处扩展特征的神经网络，其中所述接收器也...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种无线发射/接收单元(WTRU)，所述WTRU包括：接收器，所述接收器被配置为接收深度神经网络(DNN)模型的一部分，其中所述部分在所述DNN模型的分割点之前，并且其中所述DNN模型的所述部分包括用以在所述DNN模型的所述分割点处压缩特征的神经网络；一个或多个处理器，所述一个或多个处理器被配置为：获得所述神经网络的压缩因数，响应于所述压缩因数，确定将连接所述神经网络中的哪些节点，响应于所述确定，配置所述神经网络，以及利用所述DNN模型的所述部分来执行推断，以生成压缩特征；和发射器，所述发射器被配置为向另一WTRU发射所述压缩特征。2.根据权利要求1所述的设备，其中所述发射器还被配置为向所述另一WTRU发送所获得的所述压缩因数的指示。3.一种无线发射/接收单元(WTRU)，所述WTRU包括：接收器，所述接收器被配置为接收深度神经网络(DNN)模型的一部分，其中所述部分在所述DNN模型的分割点之后，并且其中所述DNN模型的所述部分包括用以在所述DNN模型的所述分割点处扩展特征的神经网络，其中所述接收器也被配置为接收从另一WTRU输出的一个或多个特征；和一个或多个处理器，所述一个或多个处理器被配置为：获得所述神经网络的压缩因数，响应于所述压缩因数，确定将连接所述神经网络中的哪些节点，响应于所述确定，配置所述神经网络，以及通过将从另一WTRU输出的所述一个或多个特征用作所述神经网络的输入，利用所述DNN模型的所述部分来执行推断。4.根据权利要求3所述的设备，其中所述接收器还被配置为接收指示所述压缩因数的信号。5.根据权利要求1至4中任一项所述的设备，其中所述压缩因数选自在推断时间可动态切换的多个压缩因数。6.根据权利要求1至5中任一项所述的设备，其中所述一个或多个处理器被配置为在调节所述压缩因数时确定将连接所述网络中的哪些节点。7.根据权利要求6所述的设备，其中所述一个或多个处理器被配置为在推断时间确定将连接所述网络中的哪些节点。8.根据权利要求1至7中任一项所述的设备，其中所述DNN模型包括多个分割点。9.根据权利要求1至8中任一项所述的设备，其中所述网络至少包括卷积层和非线性层。10.根据权利要求9所述的设备，其中所述网络还包括批归一化层。11.根据权利要求1至10中任一项所述的设备，其中针对不同的压缩因数，仅将一个DNN模型加载到所述设备。12.根据权利要求1至11中任一项所述的设备，其中基于(1)物理层操作、(2)介质访问控制层操作、(3)无线电资源控制层操作、(4)可用处理资源和(5)控制信
令中的一项或多项，调适所述分割点和所述压缩因数中的至少一项。13.根据权利要求1至12中任一项所述的设备，其中基于传输数据速率，调适所述分割点和所述压缩因数中的至少一项。14.根据权利要求13所述的设备，其中基于所述传输数据速...

【专利技术属性】
技术研发人员：S，
申请(专利权)人：交互数字CE专利控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人