一种数据压缩方法、数据解压方法及相关设备技术

技术编号：35763354 阅读：16 留言：0更新日期：2022-12-01 13:58

本申请实施例公开了一种数据压缩方法、数据解压方法及相关设备，可以应用于图像、视频、文本等数据的无损压缩。该方法可以由压缩设备执行，也可以由压缩设备的部件(例如处理器、芯片、或芯片系统等)执行。该方法包括：获取第一数据批与第二数据批，在对第一数据批进行压缩的过程中，可以根据第一数据批更新母模型得到第一模型，并用第一模型参与第二数据批的压缩。一方面，在压缩过程中，可以边对待压数据批进行压缩边对母模型进行更新，并且不用保存更新后的新模型，进而适合大规模数据集的压缩。另一方面，在母模型更新过程中，母模型会越来越符合待压缩数据批的分布，因此，压缩率会越来越高。来越高。来越高。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据压缩方法、数据解压方法及相关设备

[0001]本申请实施例涉及人工智能领域，尤其涉及一种数据压缩方法、数据解压方法及相关设备。

技术介绍

[0002]人工智能(artificial intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人，自然语言处理，计算机视觉，决策与推理，人机交互，推荐与搜索，AI基础理论等。
[0003]目前，无损压缩作为现代AI中的一个重要技术方向，无损压缩主要可以由深度生成模型来实现，深度生成模型能够非常精准地建模数据的分布从而理论上能够实现比传统算法更高的压缩率。
[0004]然而，如何在实际应用中使用深度生成模型提升数据的压缩率是亟待解决的技术问题。

技术实现思路

[0005]本申请实施例提供了一种数据压缩方法、数据解压方法及相关设备。可以提升待压缩数据批的压缩率。
[0006]本申请实施例第一方面提供了一种数据压缩方法，可以应用于图像、视频、文本等数据的无损压缩。该方法可以由压缩设备执行，也可以由压缩设备的部件(例如处理器、芯片、或芯片系统等)执行。该方法包括：获取第一数据批与第二数据批，例如获...

【技术保护点】

【技术特征摘要】
1.一种数据压缩方法，其特征在于，所述方法包括：获取第一数据批与第二数据批；获取母模型，所述母模型用于计算第一概率分布信息，所述第一概率分布信息用于表示所述第一数据批中各个变量取值的概率分布；基于所述第一数据批、所述母模型以及第一编码器压缩所述第一数据批得到第一序列，所述第一编码器与所述母模型相对应；基于所述第一数据批更新所述母模型得到第一模型；基于所述第二数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第二数据批得到第二序列。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述第三数据批；所述基于所述第二数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第二数据批得到第二序列，包括：基于所述第三数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第三数据批得到第三序列；基于所述第三数据批更新所述第一模型得到第二模型；基于所述第二数据批、所述第二模型、所述第三序列以及所述第一编码器压缩所述第二数据批得到所述第二序列。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述第三数据批；所述基于所述第二数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第二数据批得到第二序列，包括：基于所述第三数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第三数据批，得到第三序列；基于所述第二数据批、所述第一模型、所述第三序列以及所述第一编码器压缩所述第二数据批得到所述第二序列。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述基于所述第一数据批更新所述母模型得到第一模型，包括：使用优化算法以及所述第一数据批更新所述母模型得到所述第一模型，所述优化算法包括基于梯度的优化算法、元学习或强化学习。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述母模型是通过以训练数据集中的训练数据批作为神经网络模型的输入，以损失函数的值小于第一阈值为目标对所述神经网络模型进行训练获取，所述训练数据集的数据类型与待压缩数据集的数据类型相同，所述待压缩数据集包括所述第一数据批与所述第二数据批，所述损失函数用于指示所述神经网络模型输出的概率分布信息与所述训练数据批中变量取值的实际概率分布信息之间的差异。6.根据权利要求1至5中任一项所述的方法，其特征在于，所述基于所述第一数据批、所述母模型以及第一编码器压缩所述第一数据批得到第一序列，包括：将所述第一数据批输入所述母模型得到所述第一概率分布信息；
基于所述第一概率分布信息以及所述第一编码器压缩所述第一数据批得到所述第一序列。7.根据权利要求1至6中任一项所述的方法，其特征在于，所述基于所述第二数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第二数据批得到第二序列，包括：将所述第二数据批输入所述第一模型得到第二概率分布信息，所述第二概率分布信息用于表示所述第二数据批中各个变量取值的概率分布；基于所述第二概率分布信息、所述第一序列以及所述第一编码器压缩所述第二数据批得到所述第二序列。8.根据权利要求2所述的方法，其特征在于，所述基于所述第二数据批、所述第二模型、所述第三序列以及所述第一编码器压缩所述第二数据批得到第二序列，包括：将所述第二数据批输入所述第二模型得到第二概率分布信息，所述第二概率分布信息用于表示所述第二数据批中各个变量取值的概率分布；基于所述第二概率分布信息、所述第三序列以及所述第一编码器压缩所述第二数据批得到所述第二序列。9.根据权利要求3所述的方法，其特征在于，所述基于所述第二数据批、所述第一模型、所述第三序列以及所述第一编码器压缩所述第二数据批得到所述第二序列，包括：将所述第二数据批输入所述第一模型得到第二概率分布信息，所述第二概率分布信息用于表示所述第二数据批中各个变量取值的概率分布；基于所述第二概率分布信息、所述第三序列以及所述第一编码器压缩所述第二数据批得到所述第二序列。10.根据权利要求8或9所述的方法，其特征在于，所述基于所述第三数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第三数据批得到第三序列，包括：将所述第三数据批输入所述第一模型得到第三概率分布信息，所述第三概率分布信息用于表示所述第三数据批中各个变量取值的概率分布；基于所述第三概率分布信息、所述第一序列以及所述第一编码器压缩所述第三数据批得到所述第三序列。11.根据权利要求1至10中任一项所述的方法，其特征在于，所述方法还包括：基于第一关联关系确定所述母模型的类型对应的所述第一编码器，所述第一关联关系用于表示所述母模型的类型与所述第一编码器的关联关系，所述类型包括全观测模型和隐变量模型。12.根据权利要求1至10中任一项所述的方法，其特征在于，所述获取母模型，包括：基于待压缩数据集的数据类型获取所述母模型，所述数据类型包括图像数据类型与序列数据类型。13.根据权利要求1至12中任一项所述的方法，其特征在于，所述获取第一数据批与第二数据批，包括：获取待压缩数据集；拆分所述待压缩数据集得到所述第一数据批与所述第二数据批。14.一种数据压缩方法，其特征在于，所述方法包括：获取第一数据批与第二数据批；
获取母模型，所述母模型用于计算第一概率分布信息，所述第一概率分布信息用于表示所述第一数据批中各个变量取值的概率分布；基于所述第一数据批更新所述母模型得到第一模型；基于所述第二数据批、所述第一模型以及第一编码器压缩所述第二数据批得到第一序列，所述第一编码器与所述母模型相对应；基于所述第一数据批、所述母模型、所述第一序列以及所述第一编码器压缩所述第一数据批得到第二序列。15.根据权利要求14所述的方法，其特征在于，所述还包括：获取所述第三数据批；所述基于所述第二数据批、所述第一模型以及第一编码器压缩所述第二数据批得到第一序列，包括：基于所述第三数据批更新所述第一模型得到第二模型；基于所述第二数据批、所述第二模型以及第一编码器压缩所述第二数据批得到第一序列；所述基于所述第一数据批、所述母模型、所述第一序列以及所述第一编码器压缩所述第一数据批得到第二序列，包括：基于所述第三数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第三数据批得到第三序列；基于所述第一数据批、所述母模型、所述第三序列以及所述第一编码器压缩所述第一数据批得到所述第二序列。16.根据权利要求14所述的方法，其特征在于，所述还包括：获取所述第三数据批；所述基于所述第一数据批、所述母模型、所述第一序列以及所述第一编码器压缩所述第一数据批得到第二序列，包括：基于所述第三数据批、所述第一模型、所述第一序列以及所述第一编码器压缩所述第三数据批得到第三序列；基于所述第一数据批、所述母模型、所述第三序列以及所述第一编码器压缩所述第一数据批得到所述第二序列。17.一种数据解压方法，其特征在于，所述方法包括：获取第二序列；获取母模型；基于所述母模型以...

【专利技术属性】
技术研发人员：张琛，张世枫，法比奥，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人