【技术实现步骤摘要】
基于可视化的代码识别模型训练方法及装置
[0001]本公开的实施例涉及模型训练
,尤其涉及一种基于可视化的代码识别模型训练方法及装置。
技术介绍
[0002]深度学习已成为工业界智能化的发展趋势,广泛应用于外卖、配送、小象、单车、快驴等业务线。
[0003]深度学习的核心是在复杂的网络中找到最优模型,用于匹配数据,深度学习更关注于模型的设计,一个简单的改动或者一个结构的简单调整就能使得模型效果得到大幅的提升,灵活性、多样性的模型配置至关重要。而且超参数在深度学习模型训练中扮演着举足轻重的作用,超参数可用于控制算法行为。
[0004]目前,基于可视化深度学习模型组件的训练模式,算法平台提供主流的深度学习模型组件,用户在可视化界面通过拖拽的方式构建实验,不支持用户自定义网络结构。而基于自定义深度学习代码的模型训练模式,算法平台集成开源JupyterLab的形式,提供交互式编程环境,用户可在IDE中进行代码编写、调试及运行。
[0005]基于可视化深度学习模型组件的训练模式。平台对模型的输入输出类型及 ...
【技术保护点】
【技术特征摘要】
1.一种基于可视化的代码识别模型训练方法,其特征在于,包括:显示模型配置页面;获取用户在所述模型配置页面内输入的模型训练模式、模型网络结构和超参数;获取与所述模型网络结构匹配的待训练代码识别模型;根据所述模型训练模式,获取预先保存的所述待训练代码识别模型对应的代码训练样本;加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练。2.根据权利要求1所述的方法,其特征在于,在所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练之前,还包括:获取所述用户在所述模型配置页面内输入的模型输入参数和模型输出参数;所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练,包括:根据所述模型输入参数,将所述代码训练样本输入至所述待训练代码识别模型;根据所述模型输出参数,获取由所述待训练代码识别模型输出的所述代码训练样本对应的代码预测结果;根据所述代码训练样本对应的初始代码结果和所述代码预测结果,计算得到所述待训练代码识别模型对应的损失值;在所述损失值处于预设范围内的情况下,将训练后的代码识别模型作为最终的目标代码识别模型。3.根据权利要求2所述的方法,其特征在于,在所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练之前,还包括:获取所述用户在所述模型配置页面内输入的损失函数类型;所述根据所述代码训练样本对应的初始代码结果和所述代码预测结果,计算得到所述待训练代码识别模型对应的损失值,包括:根据所述初始代码结果和所述代码预测结果,计算得到所述待训练代码识别模型对应的与所述损失函数类型匹配的损失值。4.根据权利要求2所述的方法,其特征在于,在所述根据所述代码训练样本对应的初始代码结果和所述代码预测结果,计算得到所述待训练代码识别模型对应的损失值之后,还包括:在所述损失值处于所述预设范围外的情况下,获取所述损失值对应的损失梯度;根据所述损失梯度调整所述超参数,得到目标超参数;加载所述目标超参数,根据所述代码训练样本,迭代执行对所述待训练代码识别模型的训练过程,直至所述待训练代码识别模型对应的损失值处于所述预设范围内。5.根据...
【专利技术属性】
技术研发人员:刘晓娟,李兆军,尹非凡,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。