【技术实现步骤摘要】
本申请涉及机器学习领域,尤其涉及一种机器学习场景下训练数据的获取方法及设备。
技术介绍
1、在大数据和人工智能时代数据成为重要的生产资料,目前大数据技术日益成熟,各组织团体都将所需数据存入大数据平台/系统进行计算分析。
2、然而,在泛机器学习场景中(包括不限于机器学习、深度学习、联邦学习),机器学习应用或系统很难直接对接大数据平台/系统,因为训练数据通常需要二次处理后再传输至机器学习应用或系统进行训练或推理,较为繁琐、复杂。在一般机器学习场景下,训练和推理的数据准备过程往往需要人工介入通过复杂的程序实现自动化,且不可或很难进行复用。
3、因此,如何设计一个合适的在机器学习场景下获取训练数据的办法,以解决机器学习过程中数据提取分布分散、预处理繁琐、数据传输繁琐成为一个亟需解决的问题。
技术实现思路
1、本申请提供一种机器学习场景下训练数据的获取方法及设备,用以解决机器学习过程中数据提取分布分散、预处理繁琐、数据传输繁琐的问题。
2、第一方面,本专利技术实施
...【技术保护点】
1.一种机器学习场景下训练数据的获取方法,其特征在于,应用于机器学习系统,所述机器学习系统包括多个数据使用端、数据获取端和多个数据源,所述方法应用于所述数据获取端,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述数据查询语句具体包括数据标签的样本字段和训练数据的样本字段以及所述返回结果字段;
3.根据权利要求1所述的方法,其特征在于,所述根据所述数据查询子语句和所述数据类型对所述数据源进行查询,得到数据查询结果,包括:
4.根据权利要求2所述的方法,其特征在于,所述数据查询语句还包括数据标识,所述样本字段包括多个数据查
...【技术特征摘要】
1.一种机器学习场景下训练数据的获取方法,其特征在于,应用于机器学习系统,所述机器学习系统包括多个数据使用端、数据获取端和多个数据源,所述方法应用于所述数据获取端,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述数据查询语句具体包括数据标签的样本字段和训练数据的样本字段以及所述返回结果字段;
3.根据权利要求1所述的方法,其特征在于,所述根据所述数据查询子语句和所述数据类型对所述数据源进行查询,得到数据查询结果,包括:
4.根据权利要求2所述的方法,其特征在于,所述数据查询语句还包括数据标识,所述样本字段包括多个数据查询子语句,所述根据所述数据查询子语句和所述数据类型,调用所述数据源对应的调用工具对所述数据源进行查询,得到数据查询结果,包括:
5.根据权利要求1所述的方法,其特征...
【专利技术属性】
技术研发人员:杨子敬,李洁,吴洋,张亚南,郝若晶,程新洲,高洁,只璐,刘亮,杨斌,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。