【技术实现步骤摘要】
一种机器学习程序的训练方法、装置及设备
本申请涉及机器学习
,尤其是涉及一种机器学习程序的训练方法、装置及设备。
技术介绍
机器学习是实现人工智能的一种途径,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习用于研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习更加注重算法设计,使计算机能够自动地从数据中学习规律,并利用规律对未知数据进行预测。机器学习已经有了十分广泛的应用,如深度学习、数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用等等。机器学习程序是基于机器学习技术训练得到的程序,在机器学习程序的训练过程中,需要人工搜集数据集,并人工对数据集中的数据进行标定。但是,由于训练过程需要使用大量数据,因此,数据集的搜集过程的工作量较大,耗时很长。而且,数据的标定过程的工作量较大,耗时很长。 ...
【技术保护点】
1.一种机器学习程序的训练方法,其特征在于,所述方法包括:/n获取训练数据集合,所述训练数据集合包括第一类训练数据,所述第一类训练数据的置信度位于指定置信度范围;其中,所述置信度是利用机器学习程序识别出的第一类训练数据中的目标属于指定标签的置信度;/n根据所述指定标签为所述第一类训练数据添加标注信息;/n根据所述训练数据集合中的第一类训练数据的特征信息和标注信息训练新机器学习程序,所述新机器学习程序用于识别输入数据中的目标属于指定标签的置信度。/n
【技术特征摘要】
1.一种机器学习程序的训练方法,其特征在于,所述方法包括:
获取训练数据集合,所述训练数据集合包括第一类训练数据,所述第一类训练数据的置信度位于指定置信度范围;其中,所述置信度是利用机器学习程序识别出的第一类训练数据中的目标属于指定标签的置信度;
根据所述指定标签为所述第一类训练数据添加标注信息;
根据所述训练数据集合中的第一类训练数据的特征信息和标注信息训练新机器学习程序,所述新机器学习程序用于识别输入数据中的目标属于指定标签的置信度。
2.根据权利要求1所述的方法,其特征在于,所述获取训练数据集合包括:
获取第一类训练数据和所述机器学习程序的程序标识;
确定所述程序标识对应的数据集标识;
将所述第一类训练数据添加到所述数据集标识对应的训练数据集合。
3.根据权利要求1所述的方法,其特征在于,所述根据所述训练数据集合中的第一类训练数据的特征信息和标注信息训练新机器学习程序,包括:
若所述训练数据集合中的未训练使用的训练数据数量达到预设阈值,根据所述训练数据集合中的第一类训练数据的特征信息和标注信息训练新机器学习程序。
4.根据权利要求1所述的方法,其特征在于,所述根据所述训练数据集合中的第一类训练数据的特征信息和标注信息训练新机器学习程序,包括:
为机器学习程序的训练任务申请GPU资源;基于所述GPU资源,根据所述训练数据集合中的第一类训练数据的特征信息和标注信息训练新机器学习程序;在训练得到所述新机器学习程序后,释放所述GPU资源。
5.根据权利要求1-4任一项所述的方法,其特征在于,机器学习程序包括:机器学习分类程序;或,机器学习检测程序;或,机器学习分类检测混合程序。
6.一种机器学习程序的训练方法,其特征在于,所述方法包括:
利用已部署的机器学习程序识别输入数据中的目标属于指定标签的置信度;
若所述置信度位于指定置信度范围,则将所述输入数据确定为第一类训练数据,并将所述第一类训练数据添加到训练数据集合;
其中,所述训练数据集合中的第一类训练数据用于训练新机器学习程序。
7.根据权利要求6所述的方法,其特征在于,
所述将所述第一类训练数据添加到训练数据集合,包括:
确定所述机器学习程序的程序标识对应...
【专利技术属性】
技术研发人员:胡兵训,
申请(专利权)人:杭州海康威视数字技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。