使用自动编码器神经网络压缩端节点中的信息制造技术

技术编号:32900207 阅读:17 留言:0更新日期:2022-04-07 11:50
在一个实施例中,一种装置包括:传感器,用于感测真实世界信息;数字化器,其耦合到传感器以将真实世界信息数字化为数字化信息;信号处理器,其耦合到数字化器以将数字化信息处理成频谱图;神经引擎,其耦合到信号处理器,神经引擎包括自动编码器,用于将频谱图压缩成经压缩的频谱图;以及无线电路,其耦合到神经引擎以将经压缩的频谱图发送到远程目的地,以使远程目的地能够处理经压缩的频谱图。程目的地能够处理经压缩的频谱图。程目的地能够处理经压缩的频谱图。

【技术实现步骤摘要】
使用自动编码器神经网络压缩端节点中的信息

技术介绍

[0001]端节点设备通常感测和收集关于其环境的数据。例如,这种数据可以是音频或图像。通常不容许端节点对这种数据执行有意义的计算,例如进行语音识别以检测关键字或检测图像中人的存在。因此,端节点通常会将原始数据发送到云,在云中使用强大的机器学习算法来处理原始数据。然而,原始数据的传输需要带宽和功耗,这对于电池供电的设备或其他功率受限的设备而言可能是惊人地大。

技术实现思路

[0002]在一个方面,一种装置包括:传感器,用于感测真实世界信息;数字化器,其耦合到所述传感器以将所述真实世界信息数字化为数字化信息;信号处理器,其耦合到所述数字化器以将所述数字化信息处理成频谱图;神经引擎,其耦合到所述信号处理器,所述神经引擎包括自动编码器,所述自动编码器用于将所述频谱图压缩成经压缩的频谱图;以及,无线电路,其耦合到所述神经引擎以将所述经压缩的频谱图发送到远程目的地,以使得所述远程目的地能够处理所述经压缩的频谱图。
[0003]在一个示例中,神经引擎用于存储用于自动编码器的模型。该模型可以包括神经网络的结构和多个系数,并且可以是根据真实世界类型的信息使用至少一个相关函数生成的预训练模型。该装置可以从远程目的地接收更新的模型,并且基于更新的模型来更新模型的多个系数权重中的至少一些系数权重。自动编码器的解码器可以将第一经压缩的频谱图解压缩成第一重构频谱图,该第一经压缩的频谱图由自动编码器的编码器从第一频谱图压缩。
[0004]在一个示例中,该装置可以将第一频谱图与第一重构频谱图进行比较,并且至少部分地基于该比较将第一频谱图而不是第一经压缩的频谱图发送至远程目的地。该装置可以响应于来自远程目的地的请求将第一频谱图与第一重构频谱图进行比较。
[0005]在一个示例中,真实世界信息包括了语音信息,该装置包括语音控制的端节点设备。语音控制的端节点设备可以至少部分地基于经压缩的频谱图从远程目的地接收至少一个命令。真实世界信息可以是图像信息,并且该装置可以至少部分地基于图像信息,基于在远程目的地检测到图像信息中的人,响应于来自远程目的地的命令而采取动作。
[0006]在另一方面,一种方法包括:生成包括编码器和解码器的自动编码器,并生成分类器,其中,编码器用于将频谱图编码为经压缩的频谱图,解码器用于将经压缩的频谱图解码为恢复的频谱图,并且分类器用于从解码的压缩的频谱图确定至少一个关键字;计算自动编码器的第一损失并计算分类器的第二损失;至少部分地基于所述第一损失和所述第二损失来联合训练所述自动编码器和所述分类器;以及,将经训练的自动编码器和经训练的分类器存储在非暂时性存储介质中。
[0007]在一个示例中,该方法还包括基于所述第一损失与所述第二损失的加权和来联合训练所述自动编码器和所述分类器。该方法还可以包括:根据相关系数计算第一损失;根据二元交叉熵计算第二损失。该方法还可包括将自动编码器的经训练的编码器部分发送到一
个或多个端节点设备以使该一个或多个端节点设备能使用该经训练的编码器部分来压缩频谱图。该方法还可以包括从解码器不对称地生成编码器。
[0008]在又一方面,一种语音控制的设备可以包括:麦克风,用于接收语音输入;数字化器,其耦合到所述麦克风以将所述语音输入数字化为数字化信息;信号处理器,其耦合到所述数字化器以从所述数字化信息生成频谱图;控制器,其耦合到信号处理器,该控制器包括自动编码器的编码器,用于将频谱图压缩成对应于语音输入的经压缩的频谱图;以及,无线电路,其耦合到所述控制器,以将所述经压缩的频谱图发送到远程服务器,以使所述远程服务器能够处理所述经压缩的频谱图。响应于来自远程服务器的命令,控制器可以使无线电路向远程服务器发送与另一语音输入相对应的未压缩频谱图。
[0009]在一个示例中,控制器还包括自动编码器的解码器,用于将由自动编码器的编码器压缩的一个或多个经压缩的频谱图解压缩成一个或多个重构频谱图。控制器可以从远程服务器接收至少一个第二命令,并且响应于该至少一个第二命令来实现用户请求的操作,其中,语音输入包括用户请求的操作。语音控制的设备还可以包括用于存储编码器的模型的缓存。该模型可以包括神经网络的结构和多个系数权重,其中,该模型包括使用针对该频谱图的至少一个相关函数生成的预训练模型。
[0010]在一个示例中,语音控制的设备还可以包括第二缓存,用于存储编码器的第二模型,其中,第二模型包括第二神经网络的结构和多个第二系数权重。第二模型可以是使用用于图像输入的至少一个相关函数生成的预训练模型。编码器可以与自动编码器的解码器不对称,该解码器存在于远程服务器处以对该经压缩的频谱图进行解压缩,并且该解码器可以具有比编码器更大的内核和更多的滤波器或者不同的架构。
附图说明
[0011]图1是根据一个实施例的端节点设备的框图。
[0012]图2是根据一个实施例的云服务器的框图。
[0013]图3是根据一个实施例的方法的流程图。
[0014]图4是根据另一实施例的方法的流程图。
[0015]图5是根据又一实施例的方法的流程图。
[0016]图6是根据一个实施例的用于执行自动编码器和分类器的组合训练的一个系统的框图。
[0017]图7是根据一个实施例的可以作为端节点而并入无线网络中的代表性设备的框图。
[0018]图8是根据一个实施例的代表性无线自动化网络的框图。
具体实施方式
[0019]在各种实施例中,端节点设备可以被配置为感测真实世界信息,诸如语音数据、图像数据等。进而,端节点设备可以在将所感测的信息发送到诸如进一步处理数据的基于云的目的地之类的远程实体之前最少地处理该信息。
[0020]由于端节点设备通常具有有限的处理和功率资源(例如,端节点设备可以是电池供电的装置),因此可以在基于云的目的地处执行更复杂的处理。尽管实施例可以变化,但
是这里描述的实施方式可以处在语音控制的端节点设备的背景下,除其他设备类型外诸如遥控器、诸如照明、安全、HVAC组件的家庭自动化组件。对于此类语音控制的设备,所感测输入可为语音,其中,所述设备可被配置成响应于关键字而被唤醒。在唤醒之后,设备可以感测语音串,并将语音编码成一个频谱图或频谱图序列。此后,该设备使用经训练的自动编码器可将(多个)频谱图压缩成经压缩的频谱图(或经压缩的频谱图的序列)格式,其随后被发送到基于云的目的地。
[0021]在许多情况下,该端节点设备可以是一种无线使能的设备,使得到诸如基于云的目的地之类的远程源的通信可以经由无线局域网(WLAN)来进行,例如根据给定的IEEE 802.11标准,其继而例如通过网关经由诸如因特网之类的网络耦合到基于云的目的地。
[0022]尽管在某些情况下,设备本身可能使用机器学习技术来训练自动编码器,但更典型地是由于设备的有限计算和功率能力,自动编码器可被预训练并加载到端节点设备中。在已知该端节点设备的预期使用的情况下,自动编码器可以在制造期间被预加载到端节点设备中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种装置,包括:传感器,用于感测真实世界信息;数字化器,其耦合到所述传感器以将所述真实世界信息数字化为数字化信息;信号处理器,其耦合到所述数字化器以将所述数字化信息处理成频谱图;耦合到所述信号处理器的神经引擎,所述神经引擎包括自动编码器,用于将所述频谱图压缩成经压缩的频谱图;以及无线电路,其耦合到所述神经引擎以将经压缩的频谱图发送至远程目的地,以使得所述远程目的地能够处理经压缩的频谱图。2.根据权利要求1所述的装置,其中,所述神经引擎用于存储用于所述自动编码器的模型,所述模型包括神经网络的结构和多个系数,其中,所述模型包括根据所述真实世界信息的类型使用至少一个相关函数生成的经预训练的模型。3.根据权利要求2所述的装置,其中,所述装置用于从所述远程目的地接收更新的模型,并且,基于所述更新的模型来更新所述模型的多个系数权重中的至少一些系数权重。4.根据权利要求1所述的装置,其中,自动编码器的解码器用于将第一经压缩的频谱图解压缩成第一重构频谱图,所述第一经压缩的频谱图由自动编码器的编码器从第一频谱图压缩。5.根据权利要求4所述的装置,其中,所述装置用于将所述第一频谱图与所述第一重构频谱图进行比较,并且,至少部分地基于所述比较来将所述第一频谱图而不是第一经压缩的频谱图发送至所述远程目的地。6.根据权利要求5所述的装置,其中,所述装置用于响应于来自所述远程目的地的请求,将所述第一频谱图与所述第一重构频谱图进行比较。7.根据权利要求1所述的装置,其中,所述真实世界信息包括语音信息,所述装置包括语音控制的端节点设备。8.根据权利要求7所述的装置,其中,所述语音控制的端节点设备用于从所述远程目的地接收至少部分地基于经压缩的频谱图的至少一个命令。9.根据权利要求1所述的装置,其中,所述真实世界信息包括图像信息,所述装置用于响应于来自所述远程目的地的命令,基于在所述远程目的地处检测到所述图像信息中的人,至少部分地基于所述图像信息来采取动作。10.一种方法,包括:生成包括编码器和解码器的自动编码器,并生成分类器,其中,所述编码器用于将频谱图编码为经压缩的频谱图,所述解码器用于将经压缩的频谱图解码为恢复的频谱图,并且,所述分类器用于从所述解码的经压缩的频谱图确定至少一个关键词;计算自动编码器的第一损失并计算分类器的第二损失;至少部分地基于所述第一损失和所述第二损失来联合训练所述自动编码器和所述分类器;以及将所述经训练的自动编码器和所述经训练的分类器存储在非暂时性存储介质中。...

【专利技术属性】
技术研发人员:A
申请(专利权)人:硅实验室公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1