信息处理方法及装置、电子设备和存储介质制造方法及图纸

技术编号:24171309 阅读:94 留言:0更新日期:2020-05-16 03:02
本公开涉及一种信息处理方法及装置、电子设备和存储介质,其中,所述方法包括:获取第一数据类型的目标信息;基于截断值对所述第一数据类型的目标信息进行数据类型变换,得到第二数据类型的目标信息;其中,所述第二数据类型的数据精度小于所述第一数据类型,所述截断值与所述数据类型变换产生的变换误差相关;基于所述第二数据类型的目标信息,得到深度学习网络的至少一个网络层的处理结果。

【技术实现步骤摘要】
信息处理方法及装置、电子设备和存储介质
本公开涉及计算机
,尤其涉及一种信息处理方法及装置、电子设备和存储介质。
技术介绍
深度学习模型广泛应用在计算机视觉、自然语言处理等领域中,极大地推动了安防、语言识别和机器翻译等行业的发展。通过对大量已标注数据进行训练学习,深度学习模型可以实现对图片、语言等信息的识别与理解。深度学习模型具有强大的功能,但是深度学习模型通常会占用大量的计算资源,并且在处理任务时会耗费大量的计算时间。
技术实现思路
本公开提出了一种信息处理技术方案。根据本公开的一方面,提供了一种信息处理方法,包括:获取第一数据类型的目标信息;基于截断值对所述第一数据类型的目标信息进行数据类型变换,得到第二数据类型的目标信息;其中,所述第二数据类型的数据精度小于所述第一数据类型,所述截断值与所述数据类型变换产生的变换误差相关;基于所述第二数据类型的目标信息,得到深度学习网络的至少一个网络层的处理结果。在一个或多个可选实施例中,所述目标信息包括以下至少一种:图像信息、语音信息、基于所述图像信息得到的中间信息、基于所述语音信息得到的中间信息。在一个或多个可选实施例中,所述方法还包括:确定对所述第一数据类型的目标信息进行数据类型变换的数据类型变换关系;其中,所述数据类型变换关系中包括所述截断值对应的截断参数;根据所述数据类型变换关系以及所述变换误差对应的误差关系,确定所述截断参数对所述变换误差的影响;根据所述截断参数对所述变换误差的影响,确定所述截断参数的截断值。在一个或多个可选实施例中,所述方法还包括:根据所述数据类型变换前的第一参数值与所述数据类型变换后的第二参数值之间的距离,确定所述变换误差对应的误差关系。在一个或多个可选实施例中,所述根据所述截断参数对所述变换误差的影响,确定所述截断参数的截断值,包括:根据所述截断参数对所述变换误差的影响,在所述变换误差在所述截断参数的作用下达到最小值的情况下,将所述截断参数的参数值确定为所述截断值。在一个或多个可选实施例中,所述方法还包括:基于所述截断值将所述处理结果由第二数据类型转换为所述第一数据类型。在一个或多个可选实施例中,所述基于所述第二数据类型的目标信息,得到深度学习网络的至少一个网络层的处理结果,包括:基于所述第二数据类型的目标信息,将所述深度学习网络的训练误差从所述深度学习网络的至少一个网络层的输出传播到所述至少一个网络层的输入,得到第二数据类型的处理结果;其中,所述处理结果用于表示所述至少一个网络层的输入参数对于所述训练误差的影响。在一个或多个可选实施例中,所述方法还包括:确定所述目标信息从所述第一数据类型变换为所述二数据类型产生的目标变换误差;基于所述目标变换误差确定所述深度学习网络的学习率;基于所述第二数据类型的处理结果以及所述学习率,对所述深度学习网络的至少一个网络层的网络参数进行调整。在一个或多个可选实施例中,所述基于所述目标变换误差确定所述深度学习网络的学习率,包括:根据所述目标误差确定第一学习率系数;在所述第一学习率系数大于或等于预设的第二学习率系数的情况下,根据所述第一学习率系数确定所述学习率;其中,所述第一学习率系数与所述目标变换误差负相关。在一个或多个可选实施例中,所述方法还包括:在所述第一学习率系数小于所述第二学习率系数的情况下,根据所述第二学习率系数确定所述学习率。在一个或多个可选实施例中,所述方法还包括:利用所述深度学习网络对输入的图像信息进行分类;或者,利用所述深度学习网络对输入的图像信息进行识别;或者,利用所述深度学习网络对输入的图像信息进行目标检测。在一个或多个可选实施例中,所述第一数据类型为浮点型;所述第二数据类型为整数型。根据本公开的一方面,提供了一种信息处理装置,包括:获取模块,用于获取第一数据类型的目标信息;变换模块,用于基于截断值对所述第一数据类型的目标信息进行数据类型变换,得到第二数据类型的目标信息;其中,所述第二数据类型的数据精度小于所述第一数据类型,所述截断值与所述数据类型变换产生的变换误差相关;处理模块,用于基于所述第二数据类型的目标信息,得到深度学习网络的至少一个网络层的处理结果。在一个或多个可选实施例中,所述目标信息包括以下至少一种:图像信息、语音信息、基于所述图像信息得到的中间信息、基于所述语音信息得到的中间信息。在一个或多个可选实施例中,所述装置还包括:确定模块,用于确定对所述第一数据类型的目标信息进行数据类型变换的数据类型变换关系;其中,所述数据类型变换关系中包括所述截断值对应的截断参数;根据所述数据类型变换关系以及所述变换误差对应的误差关系,确定所述截断参数对所述变换误差的影响;根据所述截断参数对所述变换误差的影响,确定所述截断参数的截断值。在一个或多个可选实施例中,所述确定模块,还用于根据所述数据类型变换前的第一参数值与所述数据类型变换后的第二参数值之间的距离,确定所述变换误差对应的误差关系。在一个或多个可选实施例中,所述确定模块,具体用于根据所述截断参数对所述变换误差的影响,在所述变换误差在所述截断参数的作用下达到最小值的情况下,将所述截断参数的参数值确定为所述截断值。在一个或多个可选实施例中,所述变换模块,还用于基于所述截断值将所述处理结果由第二数据类型转换为所述第一数据类型。在一个或多个可选实施例中,所述处理模块,具体用于基于所述第二数据类型的目标信息,将所述深度学习网络的训练误差从所述深度学习网络的至少一个网络层的输出传播到所述至少一个网络层的输入,得到第二数据类型的处理结果;其中,所述处理结果用于表示所述至少一个网络层的输入参数对于所述训练误差的影响。在一个或多个可选实施例中,所述处理模块,还用于确定所述目标信息从所述第一数据类型变换为所述二数据类型产生的目标变换误差;基于所述目标变换误差确定所述深度学习网络的学习率;基于所述第二数据类型的处理结果以及所述学习率,对所述深度学习网络的至少一个网络层的网络参数进行调整。在一个或多个可选实施例中,所述处理模块,具体用于根据所述目标误差确定第一学习率系数;在所述第一学习率系数大于或等于预设的第二学习率系数的情况下,根据所述第一学习率系数确定所述学习率;其中,所述第一学习率系数与所述目标变换误差负相关。在一个或多个可选实施例中,所述处理模块,还用于在所述第一学习率系数小于所述第二学习率系数的情况下,根据所述第二学习率系数确定所述学习率。在一个或多个可选实施例中,所述装置还包括:应用模块,用于利用所述深度学习网络对输入的图像信息进行分类;或者,利用所述深度学习网络对输入的图像信息进行识别;或者,利用所述深度学习网络对输入的图像信息进行目标检测。在一个或多个可选实施例中,所述第一数据类型为浮点型;所述第二数据类型为整数型。根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行上述信息处理方法本文档来自技高网...

【技术保护点】
1.一种信息处理方法,其特征在于,包括:/n获取第一数据类型的目标信息;/n基于截断值对所述第一数据类型的目标信息进行数据类型变换,得到第二数据类型的目标信息;其中,所述第二数据类型的数据精度小于所述第一数据类型,所述截断值与所述数据类型变换产生的变换误差相关;/n基于所述第二数据类型的目标信息,得到深度学习网络的至少一个网络层的处理结果。/n

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:
获取第一数据类型的目标信息;
基于截断值对所述第一数据类型的目标信息进行数据类型变换,得到第二数据类型的目标信息;其中,所述第二数据类型的数据精度小于所述第一数据类型,所述截断值与所述数据类型变换产生的变换误差相关;
基于所述第二数据类型的目标信息,得到深度学习网络的至少一个网络层的处理结果。


2.根据权利要求1所述的方法,其特征在于,所述目标信息包括以下至少一种:图像信息、语音信息、基于所述图像信息得到的中间信息、基于所述语音信息得到的中间信息。


3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
确定对所述第一数据类型的目标信息进行数据类型变换的数据类型变换关系;其中,所述数据类型变换关系中包括所述截断值对应的截断参数;
根据所述数据类型变换关系以及所述变换误差对应的误差关系,确定所述截断参数对所述变换误差的影响;
根据所述截断参数对所述变换误差的影响,确定所述截断参数的截断值。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述数据类型变换前的第一参数值与所述数据类型变换后的第二参数值之间的距离,确定所述变换误差对应的误差关系。


5.根据权利要求3所述的方法,其特征在于,所述根据所述截断参数对所述变换误差的影响,确定所述截断参数的截断值,包括:
根据所述截断参数对所述变换误差的影响,在所述变换误差在所述截断参数的作用下达到最小值的情况下,将所述截断参数的参数值确定为所述截断值。


6.根据权利要求1至5任意一项所述的方法,其特征在于,所述方法还包括:
基于所述截断值将所述处理结果由第二数据类型转换为所述第一数据类型。


7.根据权利要求1至6任意一项所述的方法,其特征在于,所述基于所述第二数据类型的目标信息,得到深度学习网络的至少一个网络层的处理结果,包括:
基于所述第二数据类型的目标信息,将所述深度学习网络的训练误差从所述深度学习网络的至少一个网络层的输出传播到所述至少一个网络层的输入,得到第二数据类型的处理结果;其中,所述处理结果用于表示所述至少一个网络层的输入参数对于所述训练误差的影响。


8...

【专利技术属性】
技术研发人员:朱锋龚睿昊余锋伟刘祥龙闫俊杰
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1