【技术实现步骤摘要】
本说明书实施例涉及计算机,具体地,涉及数据处理方法、装置及区块链系统中的节点。
技术介绍
1、基座大模型(foundation model)是一种大型的预训练模型,通常在大量数据上进行训练,以便在各种任务中实现高性能。这类模型通常具有大量的参数和复杂的结构,能够捕捉数据中的复杂模式和关系。基座大模型在自然语言处理、计算机视觉和语音识别等领域取得了显著的成果。基座大模型的主要优势在于它们的通用性和可迁移性。一旦训练好一个基座大模型,它可以很容易地应用于各种不同的任务,只需进行少量的调整或微调;例如,使用某一行业的数据对基座大模型进行微调,就能使得微调后的基座大模型更好地理解和处理该行业的任务。这使得基座大模型在实际应用中具有很高的价值,因为它们可以大大降低开发成本和时间。由于行业数据一般掌握在大型的行业龙头企业和行业isv(independent software vendors,独立软件开发商)手中,因而基座大模型在实际应用中面临着行业数据获取难的问题。
2、迫切需要一种合理、可靠的方案,能提升掌握有行业数据的机构(如行业企
...【技术保护点】
1.一种数据处理方法,由隐私计算平台执行,所述隐私计算平台存储有预训练的基座大模型,所述方法包括:
2.根据权利要求1所述的方法,其中,所述隐私计算平台包括可信执行环境TEE,所述基座大模型存储在所述TEE中,所述微调处理在所述TEE中执行。
3.根据权利要求1所述的方法,其中,所述多个贡献方还包括算力贡献方和研发贡献方,所述算力贡献方为所述隐私计算平台归属的第二机构,所述研发贡献方为所述基座大模型归属的第三机构。
4.根据权利要求1所述的方法,其中,所述数据集中的每条数据包括作为模型输入的样本数据,以及该样本数据对应的标签数据;<
...【技术特征摘要】
1.一种数据处理方法,由隐私计算平台执行,所述隐私计算平台存储有预训练的基座大模型,所述方法包括:
2.根据权利要求1所述的方法,其中,所述隐私计算平台包括可信执行环境tee,所述基座大模型存储在所述tee中,所述微调处理在所述tee中执行。
3.根据权利要求1所述的方法,其中,所述多个贡献方还包括算力贡献方和研发贡献方,所述算力贡献方为所述隐私计算平台归属的第二机构,所述研发贡献方为所述基座大模型归属的第三机构。
4.根据权利要求1所述的方法,其中,所述数据集中的每条数据包括作为模型输入的样本数据,以及该样本数据对应的标签数据;
5.根据权利要求1所述的方法,其中,所述贡献值评估策略包括,根据数据集的数据条数进行贡献值评估的第一策略;
6.根据权利要求1所述的方法,其中,所述贡献值评估策略包括,根据数据集的数据质量进行贡献值评估的第二策略;
7.一种数据处理方法,由区块链系统中的节点执行,所述区块链系统部署有用于对行业大模型的多个贡献方进行模型服务收益分配的智能合约,所述行业大模型通过根据多个第一机构分别提供的数据集对预训练的基座大模型进行微调处理而获得,所述多个贡献方包括作为数据贡献方的各第一机构,所述智能合约根据所述多个贡...
【专利技术属性】
技术研发人员:王志勇,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。