基于联邦大模型的表格数据处理方法及相关设备技术

技术编号：40548132 阅读：24 留言：0更新日期：2024-03-05 19:06

本申请公开一种基于联邦大模型的表格数据处理方法及相关设备，方法包括：对第一表格数据进行预处理，得到第二表格数据；将第二表格数据进行序列化处理，得到n‑1个序列文本；使用LLM分词器对n‑1个序列文本中的每一序列文本进行分词处理，得到多个分词集，将多个分词集中的每一分词集转换成token形式，得到多个token，并通过预设字典获取多个token中每一token对应的token‑ID，得到多个token‑ID；根据多个分词集和多个token‑ID对本地模型进行优化处理，得到目标模型参数，通过云端将目标模型参数以及其他设备上传的模型参数进行安全聚合，将安全聚合后的全局模型参数下发给电子设备。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及隐私计算以及计算机，具体涉及一种基于联邦大模型的表格数据处理方法及相关设备。

技术介绍

1、大语言模型(large language model，llm)在文本领域取得了巨大的成功。传统的深度学习方法在表格数据领域的分类任务上表现不如强大的传统基线方法(如梯度提升树)，而llm在这个领域中，大型预训练模型被证明是实现卓越性能的关键。目前的大模型是在公域的大量非格式化文本数据集上训练的，针对私域的格式化表格(csv、excel)数据缺乏对应的处理和应用，llm是在非格式化的文本数据预训练得到，无法直接应用到表格数据上，因此，如何将llm应用在表格数据的问题亟待解决。

技术实现思路

1、本申请实施例提供了一种基于联邦大模型的表格数据处理方法及相关设备，可以将llm应用在表格数据上，且提升模型精度。

2、第一方面，本申请实施例提供一种基于联邦大模型的表格数据处理方法，应用于电子设备，所述电子设备包括针对目标业务场景的本地模型，所述方法包括：

3、获取与所述目标业...

【技术保护点】

1.一种基于联邦大模型的表格数据处理方法，其特征在于，应用于电子设备，所述电子设备包括针对目标业务场景的本地模型，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述第一表格数据进行预处理，得到第二表格数据，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述将所述第二表格数据进行序列化处理，得到n-1个序列文本，包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1或2所述的方法，其特征在于，所述获取与所述目标业务场景对应的第一表格数据，包括：

6.一种基于联邦大模型的表格...

【技术特征摘要】

1.一种基于联邦大模型的表格数据处理方法，其特征在于，应用于电子设备，所述电子设备包括针对目标业务场景的本地模型，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述第一表格数据进行预处理，得到第二表格数据，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述将所述第二表格数据进行序列化处理，得到n-1个序列文本，包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1或2所述的方法，其特征在于，所述获取与所述目标业务场景对应的第一表格数据，包括：

6.一种基于联邦大模型的表格数据处理装置，其特征在于，应用于电子设备，所述电子设备包括针对目标业务场景的本地模型，所述装置包括：获取单元、预处...

【专利技术属性】
技术研发人员：李振飞，黄一珉，王湾湾，何浩，姚明，
申请(专利权)人：深圳市洞见智慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人