一种基于自回归生成式大模型的多媒体数据压缩方法技术

技术编号:42806136 阅读:33 留言:0更新日期:2024-09-24 20:50
本发明专利技术公开了一种基于自回归生成式大模型的多媒体数据压缩方法,包括下来步骤:S1.压缩前的数据处理:将待压缩的数据进行裁切,转变为对应的符号串;S2.将得到的符号串输入自回归生成式大模型,输出符号串中每一个符号的后验概率分布估计;S3.利用后验概率分布估计,使用算数编码算法对符号串进行编码,最终得到压缩结果。本发明专利技术不仅优化了数据处理效率,而且对通信技术的发展具有重要影响。通过实现高效的数据压缩,可以在相同的带宽条件下传输更多的信息,从而显著提升通信效率和数据传输速度。这种技术的应用场景广泛,包括但不限于网络传输、数据存储、多媒体内容分发等,对于需要高速、高效率数据交换的场合尤为适用。

【技术实现步骤摘要】

本专利技术涉及用多媒体数据压缩,具体涉及基于自回归生成式大模型的多媒体数据压缩方法


技术介绍

1、在多媒体数据压缩
,现有的通用压缩算法广泛应用于各种数据模态,包括文本、图片、音频和视频数据。这些算法通常基于变长编码方法设计,例如rar、zip、7z、bzip2、gzip等,它们在数据压缩方面取得了一定的成果。

2、针对特定类型的多媒体数据,也有专门设计的压缩算法,以期获得更好的压缩效果。例如,图片数据的压缩算法包括png、jpeg、webp;音频数据的压缩算法有flac、alac;视频数据的压缩算法则有mpeg、h.264等。这些专门算法在特定应用场景下表现出色,但它们通常针对某一类型的数据优化,缺乏通用性。

3、无论是通用算法还是专门算法,在进行无损压缩时,压缩比通常较低,这限制了它们在需要高压缩比的应用场景中的使用。这是因为传统的压缩方法依赖于各种统计量或香农熵,或其他可计算属性。这些方法虽然易于计算和实现,但经过多年的研究,性能已经达到了极限。


技术实现思路p>

1、本专利本文档来自技高网...

【技术保护点】

1.一种基于自回归生成式大模型的多媒体数据压缩方法,其特征在于,包括下列步骤:

2.根据权利要求1所述的基于自回归生成式大模型的多媒体数据压缩方法,其特征在于,在所述步骤S1中,对于文本数据,根据自然语言大模型的上下文窗口裁切成长度合适的文本串,之后分别投入文本分词器,从而使该文本数据全部转变为符号串。

3.根据权利要求1所述的基于自回归生成式大模型的多媒体数据压缩方法,其特征在于,在所述步骤S1中,对于图片数据,首先根据图片大模型的上下文窗口裁切成合适的子图片,将每张子图片的每行像素从上到下逐行连接,从而将二维的图片转化为一维的像素串,最后分别投入图片分词器,从...

【技术特征摘要】

1.一种基于自回归生成式大模型的多媒体数据压缩方法,其特征在于,包括下列步骤:

2.根据权利要求1所述的基于自回归生成式大模型的多媒体数据压缩方法,其特征在于,在所述步骤s1中,对于文本数据,根据自然语言大模型的上下文窗口裁切成长度合适的文本串,之后分别投入文本分词器,从而使该文本数据全部转变为符号串。

3.根据权利要求1所述的基于自回归生成式大模型的多媒体数据压缩方法,其特征在于,在所述步骤s1中,对于图片数据,首先根据图片大模型的上下文窗口裁切成合适的子图片,将每张子图片的每行像素从上到下逐行连接,从而将二维的图片转化为一维的像素串,最后分别投入图片分词器,从而使该图片数据全部转变为符号串。

4.根据权利要求1所述的基于自回归生成式大模型的多媒体数据压缩方法,其特征在于,在所述步骤s1中,对于音频数据,对于音频的每一帧,将其映射成一个合法的字符;此时一个音频被映射为一个长文本串,根据音频大模型的上下文窗口裁切成长度合适的文本串,之后分别投入文本分词器,从而使该文本数据全部转变为符号串。

5.根据权利要求4所述的基于自回归生成式大模型的多媒体数据压缩方法,...

【专利技术属性】
技术研发人员:李明刘兴武李子光黄晁王绪亮胡海波卜东波于全高文
申请(专利权)人:中原人工智能产业技术研究院
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1