一种应用非公开数据的模型定制方法、系统及存储介质技术方案

技术编号:36895194 阅读:11 留言:0更新日期:2023-03-15 22:25
本申请公开了一种应用非公开数据的模型定制方法、系统及存储介质。方法包括:模型需求方在模型定制系统发布模型需求任务;其中,模型需求任务描述了待需求模型的功能与待需求模型的输入输出属性;模型提供方在领取模型需求任务的情况下,基于待需求模型的功能,构建模型架构,并基于待需求模型的输入输出属性在模型定制系统发布待应用训练数据源需求;数据提供方基于待应用训练数据源需求提供对应的待应用训练数据源;模型提供方利用待应用训练数据源对模型架构进行训练,并将训练收敛的待需求模型返回给模型需求方。本申请通过上述方法实现了在不泄露数据内容的前提下为模型需求方提供定制模型。求方提供定制模型。求方提供定制模型。

【技术实现步骤摘要】
一种应用非公开数据的模型定制方法、系统及存储介质


[0001]本申请涉及数据应用和机器学习
,尤其涉及一种应用非公开数据的模型定制方法、系统及存储介质。

技术介绍

[0002]数据与土地、劳动力、资本、技术、并列作为重要的生产要素以来,数据交易和数据共享的概念受到社会各界的广泛关注。以数据作为生产要素,与土地、劳动力等传统要素不同,由于数据的隐私性和可复制性,其定价方式、开放方式和应用方式都有很强的特异性,而对于数据所有权的认定本身就是公认存在争议的问题,这更增加了数据开放和数据交易的难度。
[0003]随着人工智能技术的发展,计算机视觉、自然语言处理、语义分析、时间序列预测、智能评分等算法在各行各业都发挥着越来越重要的作用。与传统的分析方法不同,人工智能模型的构造需要使用大量历史数据进行训练,模型的效果与数据质量、数据质量都有很大的相关性。由于人工智能模型的应用范围越来越广,且训练模型对于数据依赖性很高,利用数据进行人工智能模型训练成为对数据要素进行应用的重要场景。
[0004]由于数据的可复制性,决定了在对数据要素进行应用时与其他要素有明显区别,如何在不泄露数据内容的前提下应用数据进行模型训练,进而对模型进行应用,发挥数据要素价值,成为当前数据交易、数据应用行业的重大问题。

技术实现思路

[0005]本申请实施例提供了一种应用非公开数据的模型定制方法、系统及存储介质,用以解决如下技术问题:如何在不泄露数据内容的前提下为模型需求方提供定制模型。
[0006]第一方面,本申请实施例提供了一种应用非公开数据的模型定制方法,其特征在于,应用于模型定制系统,方法包括:模型需求方在模型定制系统发布模型需求任务;其中,模型需求任务描述了待需求模型的功能与待需求模型的输入输出属性;模型提供方在领取模型需求任务的情况下,基于待需求模型的功能,构建模型架构,并基于待需求模型的输入输出属性在模型定制系统发布待应用训练数据源需求;数据提供方基于待应用训练数据源需求提供对应的待应用训练数据源;模型提供方利用待应用训练数据源对模型架构进行训练,并将训练收敛的待需求模型返回给模型需求方。
[0007]在本申请的一种实现方式中,模型定制系统包括:模型集市模块、数据中心模块、训练靶场模块、前端交互界面;模型集市模块,用于模型需求方发布模型需求任务,用于模型提供方发布已有需求模型,以及用于模型提供方领取并递交模型需求任务;数据中心模块,用于存储数据提供方上传的训练数据源,以及用于将训练数据源的描述信息发送至前端交互界面展示;其中,描述信息至少包括:字段意义、字段属性、数据条数、数据空缺量、样例数据;训练靶场模块,用于接收模型提供方上传的模型架构与数据提供方上传的待应用训练数据源,以及用于基于待应用训练数据源将模型架构训练为收敛的待需求模型。
[0008]在本申请的一种实现方式中,模型需求方在模型定制系统发布模型需求任务之前,方法还包括:模型需求方基于模型需求,在模型集市模块中检索是否存在符合需求的已有需求模型;在确定模型集市模块中存在符合需求的已有需求模型的情况下,向对应的模型提供方发送应用请求。
[0009]在本申请的一种实现方式中,数据提供方基于待应用训练数据源需求提供对应的待应用训练数据源,具体包括:基于待应用训练数据源需求,在数据中心模块中确定对应的原始待应用训练数据源,对原始待应用训练数据源进行脱敏处理以确定对应的待应用训练数据源;将待应用训练数据源上传至训练靶场模块。
[0010]在本申请的一种实现方式中,在模型提供方发布已有需求模型之后,方法还包括:对已有需求模型添加模型属性信息,并将模型属性信息发送至前端交互界面进行展示;其中,模型属性信息包括:模型功能描述、模型应用场景、模型使用条件以及模型测试效果。
[0011]第二方面,本申请实施例还提供了一种应用非公开数据的模型定制系统,其特征在于,系统包括:模型需求方、模型提供方、数据提供方;模型需求方,用于在模型定制系统发布模型需求任务;其中,模型需求任务描述了待需求模型的功能与待需求模型的输入输出属性;模型提供方,用于在领取模型需求任务的情况下,基于待需求模型的功能,构建模型架构,并基于待需求模型的输入输出属性在模型定制系统发布待应用训练数据源需求;数据提供方,用于基于待应用训练数据源需求提供对应的待应用训练数据源;模型提供方,还用于利用待应用训练数据源对模型架构进行训练,并将训练收敛的待需求模型返回给模型需求方。
[0012]在本申请的一种实现方式中,模型定制系统还包括:模型集市模块、数据中心模块、训练靶场模块、前端交互界面;模型集市模块,用于模型需求方发布模型需求任务,用于模型提供方发布已有需求模型,以及用于模型提供方领取并递交模型需求任务;数据中心模块,用于存储数据提供方上传的训练数据源,以及用于将训练数据源的描述信息发送至前端交互界面展示;其中,描述信息至少包括:字段意义、字段属性、数据条数、数据空缺量、样例数据;训练靶场模块,用于接收模型提供方上传的模型架构与数据提供方上传的待应用训练数据源,以及用于基于待应用训练数据源将模型架构训练为收敛的待需求模型。
[0013]在本申请的一种实现方式中,模型需求方,还用于基于模型需求,在模型集市模块中检索是否存在符合需求的已有需求模型,并在确定模型集市模块中存在符合需求的已有需求模型的情况下,向对应的模型提供方发送应用请求;模型提供方,还用于对已有需求模型添加模型属性信息,并将模型属性信息发送至前端交互界面进行展示;其中,模型属性信息包括:模型功能描述、模型应用场景、模型使用条件以及模型测试效果。
[0014]在本申请的一种实现方式中,数据提供方基于待应用训练数据源需求提供对应的待应用训练数据源,具体包括:基于待应用训练数据源需求,在数据中心模块中确定对应的原始待应用训练数据源,对原始待应用训练数据源进行脱敏处理以确定对应的待应用训练数据源;将待应用训练数据源上传至训练靶场模块。
[0015]第三方面,本申请实施例还提供了一种应用非公开数据的模型定制的非易失性计算机存储介质,存储有计算机可执行的指令,其特征在于,计算机可执行指令设置为:模型需求方在模型定制系统发布模型需求任务;其中,模型需求任务描述了待需求模型的功能与待需求模型的输入输出属性;模型提供方在领取模型需求任务的情况下,基于待需求模
型的功能,构建模型架构,并基于待需求模型的输入输出属性在模型定制系统发布待应用训练数据源需求;数据提供方基于待应用训练数据源需求提供对应的待应用训练数据源;模型提供方利用待应用训练数据源对模型架构进行训练,并将训练收敛的待需求模型返回给模型需求方。
[0016]本申请实施例提供的一种应用非公开数据的模型定制方法、系统及存储介质,通过构造的模型集市,数据中心和训练靶场,将数据需求方、数据提供方、模型提供方三方的资源、需求和能力进行整合与对接,共同构造完整的模型构造、和数据应用流程,激活数据要素和技术要素的价值,实现需求和资源的良好对接,数据价值、技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用非公开数据的模型定制方法,其特征在于,应用于模型定制系统,所述方法包括:模型需求方在所述模型定制系统发布模型需求任务;其中,所述模型需求任务描述了待需求模型的功能与待需求模型的输入输出属性;模型提供方在领取所述模型需求任务的情况下,基于所述待需求模型的功能,构建模型架构,并基于所述待需求模型的输入输出属性在所述模型定制系统发布待应用训练数据源需求;数据提供方基于所述待应用训练数据源需求提供对应的待应用训练数据源;所述模型提供方利用所述待应用训练数据源对所述模型架构进行训练,并将训练收敛的待需求模型返回给模型需求方。2.根据权利要求1所述的一种应用非公开数据的模型定制方法,其特征在于,模型定制系统包括:模型集市模块、数据中心模块、训练靶场模块、前端交互界面;所述模型集市模块,用于模型需求方发布模型需求任务,用于模型提供方发布已有需求模型,以及用于模型提供方领取并递交模型需求任务;所述数据中心模块,用于存储数据提供方上传的训练数据源,以及用于将训练数据源的描述信息发送至前端交互界面展示;其中,所述描述信息至少包括:字段意义、字段属性、数据条数、数据空缺量、样例数据;所述训练靶场模块,用于接收模型提供方上传的模型架构与数据提供方上传的待应用训练数据源,以及用于基于待应用训练数据源将模型架构训练为收敛的待需求模型。3.根据权利要求2所述的一种应用非公开数据的模型定制方法,其特征在于,模型需求方在模型定制系统发布模型需求任务之前,所述方法还包括:所述模型需求方基于模型需求,在所述模型集市模块中检索是否存在符合需求的已有需求模型;在确定所述模型集市模块中存在符合需求的已有需求模型的情况下,向对应的模型提供方发送应用请求。4.根据权利要求2所述的一种应用非公开数据的模型定制方法,其特征在于,数据提供方基于所述待应用训练数据源需求提供对应的待应用训练数据源,具体包括:基于所述待应用训练数据源需求,在所述数据中心模块中确定对应的原始待应用训练数据源,对所述原始待应用训练数据源进行脱敏处理以确定对应的待应用训练数据源;将待应用训练数据源上传至所述训练靶场模块。5.根据权利要求2所述的一种应用非公开数据的模型定制方法,其特征在于,在模型提供方发布已有需求模型之后,所述方法还包括:对所述已有需求模型添加模型属性信息,并将所述模型属性信息发送至前端交互界面进行展示;其中,所述模型属性信息包括:模型功能描述、模型应用场景、模型使用条件以及模型测试效果。6.一种应用非公开数据的模型定制系统,其特征在于,所述系统包括:模型需求方、模型提供方、数据提供方;所述模型需求方,用于在模型定制系统发布模型需求任务;其中,所述模型需求任务描述了待需求模型的功能与待需求模型的输入输出属性;
所述模型提供方...

【专利技术属性】
技术研发人员:孙永超赵海兴董晨晨傅玉鑫
申请(专利权)人:浪潮卓数大数据产业发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1