System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于数据压缩和解压缩的方法、装置、设备和可读介质制造方法及图纸_技高网

用于数据压缩和解压缩的方法、装置、设备和可读介质制造方法及图纸

技术编号:41200041 阅读:2 留言:0更新日期:2024-05-07 22:27
本公开的实施例提供用于数据压缩和解压缩的方法、装置、设备和可读介质。一种用于数据压缩的方法包括:基于第一提示词和待压缩的目标数据,生成针对第一目标模型的第一输入序列,第一目标模型基于语言模型来构建,第一提示词指示第一目标模型执行数据压缩任务;通过向第一目标模型提供第一输入序列,获得第一目标模型的第一输出序列;以及从第一输出序列中提取目标数据的压缩表示,压缩表示为目标数据的向量化表示。以此方式,可以通过向语言模型输入相应的提示词,借助语言模型来实现数据压缩和数据解压缩。可以方便快捷地实现数据压缩和数据解压缩的同时,提高数据压缩和数据解压缩的质量。

【技术实现步骤摘要】

本公开的示例实施例总体涉及计算机领域,特别地涉及用于数据压缩和解压缩的方法、装置、设备和计算机可读存储介质。


技术介绍

1、随着信息技术的飞速发展,数据压缩技术(也可以被称之为信息压缩技术)涉及生活和工业的方方面面,给人们带来了诸多便利。数据压缩技术是一种通过降低数据大小来提高存储效率和传输速度的技术。数据压缩和解压缩在很多应用场景中均有重要用途。


技术实现思路

1、在本公开的第一方面,提供了一种用于数据压缩的方法。该方法包括:基于第一提示词和待压缩的目标数据,生成针对第一目标模型的第一输入序列,第一目标模型基于语言模型来构建,第一提示词指示第一目标模型执行数据压缩任务;通过向第一目标模型提供第一输入序列,获得第一目标模型的第一输出序列;以及从第一输出序列中提取目标数据的压缩表示,压缩表示为目标数据的向量化表示。

2、在本公开的第二方面,提供了一种数据解压缩的方法。该方法包括:获取目标数据的压缩表示,压缩表示为目标数据的向量化表示;基于第二提示词和压缩表示,生成针对第二目标模型的第二输入序列,第二目标模型基于语言模型来构建,第二提示词指示第二目标模型执行数据解压缩任务;通过向第二目标模型提供第二输入序列,获得数据解压缩模型的第二输出序列;以及从第二输出序列中确定解压缩后的目标数据。

3、在本公开的第三方面,提供了一种用于数据压缩的装置。该装置包括:第一输入生成模块,被配置为基于第一提示词和待压缩的目标数据,生成针对第一目标模型的第一输入序列,第一目标模型基于语言模型来构建,第一提示词指示第一目标模型执行数据压缩任务;第一输出获取模块,被配置为通过向第一目标模型提供第一输入序列,获得第一目标模型的第一输出序列;以及压缩表示提取模块,被配置为从第一输出序列中提取目标数据的压缩表示,压缩表示为目标数据的向量化表示。

4、在本公开的第四方面,提供了一种用于数据解压缩的装置。该装置包括:压缩表示获取模块,被配置为获取目标数据的压缩表示,压缩表示为目标数据的向量化表示;第二输入生成模块,被配置为基于第二提示词和压缩表示,生成针对第二目标模型的第二输入序列,第二目标模型基于语言模型来构建,第二提示词指示第二目标模型执行数据解压缩任务;第二输出获取模块,被配置为通过向第二目标模型提供第二输入序列,获得数据解压缩模型的第二输出序列;以及目标数据确定模块,被配置为从第二输出序列中确定解压缩后的目标数据。

5、在本公开的第五方面,提供了一种电子设备。该设备包括至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令在由至少一个处理单元执行时使设备执行第一方面的方法或执行第二方面的方法。

6、在本公开的第六方面,提供了一种计算机可读存储介质。该计算机可读存储介质上存储有计算机程序,计算机程序可由处理器执行以实现第一方面的方法或实现第二方面的方法。

7、应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种用于数据压缩的方法,包括:

2.根据权利要求1所述的方法,其中所述第一提示词还指示以下至少一项:所述目标数据的类型,所述目标数据的模态。

3.根据权利要求1所述的方法,其中在所述第一输入序列中,所述目标数据位于所述第一提示词之前。

4.根据权利要求1所述的方法,其中所述第一输入序列还包括所述目标数据的压缩表示对应的预定符号,并且其中从所述第一输出序列中提取所述目标数据的压缩表示包括:

5.根据权利要求1所述的方法,其中所述目标数据包括以下之一:文本,图像,视频,语音。

6.根据权利要求1至5中任一项所述的方法,其中所述目标数据包括非文本模态的数据,并且生成针对第一目标模型的第一输入序列包括:

7.根据权利要求1所述的方法,其中所述压缩表示包括至少一个预定维度的向量化表示,并且其中所述第一提示词指示要输出的所述预定维度的向量化表示的数目。

8.一种数据解压缩的方法,包括:

9.根据权利要求8所述的方法,其中所述第二提示词还指示以下至少一项:待解压缩的所述目标数据的类型、待解压缩的所述目标数据的模态。

10.根据权利要求8所述的方法,其中在所述第二输入序列中,所述压缩表示位于所述第二提示词之前。

11.根据权利要求8所述的方法,其中所述目标数据包括以下之一:文本,图像,视频,语音。

12.根据权利要求8至11中任一项所述的方法,其中所述目标数据包括非文本模态的数据,并从所述第二输出序列中确定解压缩后的所述目标数据包括:

13.一种用于数据压缩的装置,包括:

14.一种用于数据解压缩的装置,包括:

15.一种电子设备,包括:

16.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可由处理器执行以实现根据权利要求1至7中任一项所述的方法或权利要求8至12中任一项所述的方法。

...

【技术特征摘要】

1.一种用于数据压缩的方法,包括:

2.根据权利要求1所述的方法,其中所述第一提示词还指示以下至少一项:所述目标数据的类型,所述目标数据的模态。

3.根据权利要求1所述的方法,其中在所述第一输入序列中,所述目标数据位于所述第一提示词之前。

4.根据权利要求1所述的方法,其中所述第一输入序列还包括所述目标数据的压缩表示对应的预定符号,并且其中从所述第一输出序列中提取所述目标数据的压缩表示包括:

5.根据权利要求1所述的方法,其中所述目标数据包括以下之一:文本,图像,视频,语音。

6.根据权利要求1至5中任一项所述的方法,其中所述目标数据包括非文本模态的数据,并且生成针对第一目标模型的第一输入序列包括:

7.根据权利要求1所述的方法,其中所述压缩表示包括至少一个预定维度的向量化表示,并且其中所述第一提示词指示要输出的所述预定维度的向量化表示的数目。

8.一...

【专利技术属性】
技术研发人员:迟禄袁泽寰
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1