深度学习模型构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:29399558 阅读:24 留言:0更新日期:2021-07-23 22:36
本申请提供一种深度学习模型构建方法、装置、电子设备及存储介质,涉及深度学习技术领域。该方法包括:确定深度学习模型的框架类型;基于对深度学习模型的多个操作组件的操作指令生成有向无环图;基于所述有向无环图和所述框架类型生成指定深度学习模型;根据所述指定深度学习模型的模型结构对所述指定深度学习模型进行训练。通过深度学习模型的操作组件配置,可以自动生成深度学习模型代码,并配置化进行模型训练,提高深度学习模型的开发效率,进一步降低深度学习模型开发的门槛。

【技术实现步骤摘要】
深度学习模型构建方法、装置、电子设备及存储介质
本申请涉及深度学习
,具体而言,涉及一种深度学习模型构建方法、装置、电子设备及存储介质。
技术介绍
作为机器学习发展到一定阶段的产物,近年来深度学习技术之所以能引起社会各界广泛的关注,是因为不光在学术界,同时也在工业界取得了重大突破和广泛的应用。其中应用最广的几个研究领域分别是自然语言处理、语音识别和图像处理等。深度学习大大提升了计算机视觉、自然语言处理、语音识别的识别能力,因此在工业界得到了大量的应用,各种基于深度学习的应用如井喷式发展,比如面向金融领域的人脸识别,活体识别,身份证OCR(OpticalCharacterRecognition,光学字符识别)识别;面向客服领域的智能客服,人机对话,智能催收;面向工业界的物体缺陷检测;面向安全领域的人脸门禁,高空抛物检测,智慧安防等等都是基于深度学习的应用。因此,全世界产生了大量的深度学习算法工程师,使用深度学习技术解决现实生活中的各类问题。但是,深度学习的开发框架多种多样,有Tensorflow、Mxnet、Keras、Pytorch以及PaddlePaddle等,其语法掌握起来有一定的难度,同时业务需求很多,需要快速上线,深度学习算法的识别能力主要取决于网络结构的设计,设计算法就是在设计神经网络结构,网络结构所依赖的底层操作函数各个框架都是一样的,只是需要进行不同的组装而已。深度学习的网络结构也是经常需要展示和研究的,大部分都是代码,从代码很难看到网络结构或者很难快速知道其网络结构如何,因此在深度学习模型开发时需要进行较为复杂的模型架构和配置,需要较为专业的工作人员,同时存在深度学习模型建模和训练效率较低的问题。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种深度学习模型构建方法、装置、电子设备及存储介质,以改善现有技术中在深度学习模型开发时需要进行较为复杂的模型架构和配置,导致建模和训练效率较低的问题。本申请实施例提供了一种深度学习模型构建方法,所述方法包括:确定深度学习模型的框架类型;基于对深度学习模型的多个操作组件的操作指令生成有向无环图;基于所述有向无环图和所述框架类型生成指定深度学习模型;根据所述指定深度学习模型的模型结构对所述指定深度学习模型进行训练。在上述实现方式中,通过深度学习模型的操作组件配置,可以自动生成深度学习模型代码,用户只需要基于神经网络的基础操作组件,进行组件参数的配置,基于组件组装其神经网络结构,选择一种深度学习框架,便可以自动生成深度学习模型代码,并配置化进行模型训练,由于操作组件和有向无环图等为可视化,进一步降低了深度学习模型开发门槛和复杂性,从而提高了深度学习模型的开发效率。可选地,所述操作指令包括点击和拖拽,所述基于对深度学习模型的操作组件的操作指令生成有向无环图,包括:监听对所述多个操作组件的点击事件,在所述点击事件触发时获取所述多个操作组件的配置参数;监听所述多个操作组件的拖曳事件,在所述多个操作组件触发拖曳事件时获取所述多个操作组件的节点并计算所有所述节点的父子关系;基于所述父子关系和所述连线操作在所述多个操作组件之间添加连线,以生成所述有向无环图。在上述实现方式中,通过操作组件的点击事件和拖曳事件确定用户对操作组件的选取和连接操作,自动生成有向无环图,实现了深度学习模型的框架自动生成和配置,从而提高了深度学习模型构建的效率。可选地,在所述基于对深度学习模型的多个操作组件的操作指令生成有向无环图之前,所述方法还包括:采用图可视化编辑器生成所述深度学习模型中的操作对应的所述多个操作组件。在上述实现方式中,通过图可视化编辑器实现操作组件的可视化展示,可以帮助用户对深度学习模型进行可视化操作和分析,便于用户进行模型构建。可选地,所述采用图可视化编辑器生成所述深度学习模型中的操作对应的所述多个操作组件,包括:通过所述图可视化编辑器注册canvas事件;采用所述图可视化编辑器绘制所述多个操作组件中每个操作组件对应的图标;对所述图标注册拖曳监听事件,以在所述图标的拖曳事件触发所述拖曳监听事件时触发所述canvas事件;在所述canvas事件被触发时,通过所述图可视化编辑器的addModel添加所述多个操作组件;采用所述图可视化编辑器的点击监听事件监听所述多个操作组件的点击操作,在所述点击监听事件触发时获取模型参数标签进行渲染,所述模型参数标签用于表示操作组件的配置参数。在上述实现方式中,首先完成操作组件图标绘制,然后通过拖曳监听事件和点击监听事件对操作组件的拖曳事件和点击事件进行监听,从而在用户对某个操作组件进行操作时对该操作组件进行对应的渲染和配置,实现了深度学习模型构建的自动化。可选地,所述基于所述有向无环图和所述框架类型生成指定深度学习模型,包括:基于所述框架类型导入框架包,所述框架包包括所述框架类型的深度学习模型的操作组件结构;根据所述指定深度学习模型的名称,基于所述操作组件结构生成网络类;基于所述有向无环图和所述多个操作组件中每个操作组件对应的所述配置参数,确定所述指定深度学习模型中与所述操作组件对应的功能层的层代码;基于所述有向无环图中所述多个操作组件的连接顺序将所述层代码进行连接,以生成指定深度学习模型代码;对所述指定深度学习模型代码进行编译,以获得所述指定深度学习模型。在上述实现方式中,基于有向无环图中的操作组件和配置数据生成深度学习模型的代码,不需要用户手工进行深度学习模型的代码输入,且基于该深度学习模型代码编译直接生成深度学习模型,提高了深度模型构建效率。可选地,在所述基于所述有向无环图和所述框架类型生成指定深度学习模型之后,所述方法还包括:基于所述指定深度学习模型代码生成深度学习模型结构图。在上述实现方式中,基于指定深度学习模型代码生成深度学习模型结构图后,能够展示深度学习的网络结构,方便用户可视化的查看模型的网络设计和参数。可选地,所述基于所述指定深度学习模型代码生成深度学习模型结构图,包括:基于所述指定深度学习模型代码确定所述指定深度学习模型对应的所述框架类型;基于所述框架类型确定所述指定深度学习模型代码中的所述多个操作组件的组件结构;基于所述多个操作组件的有序代码和调用数据确定组件关键字、组件顺序和配置参数;基于所述组件关键字和所述配置参数确定所述多个操作组件;采用图编辑技术基于所述组件顺序进行所述多个操作组件构建和连线,并基于所述配置参数为所述多个操作组件增加配置信息。在上述实现方式中,就要框架类型、操作组件的组件结构、有序代码和调用数据,能够确定多个操作组件的在模型中的位置顺序,从而采用图编辑技术进行多个操作组件构建和连线,能够准确地获得深度学习模型的结构图。本申请实施例还提供了一种深度学习模型构建装置,所述装置包括:框架确定模块,用于确定深度学习模型的框架类型;图生成模块,用于基于对深度学习模型的多个操作组件的操作指令生成有向无环图;模型构建模块,用于基于所述有向无环图和所述框架类型生成指定深度学习模型;训练模块,用于根据所本文档来自技高网
...

【技术保护点】
1.一种深度学习模型构建方法,其特征在于,所述方法包括:/n确定深度学习模型的框架类型;/n基于对深度学习模型的多个操作组件的操作指令生成有向无环图;/n基于所述有向无环图和所述框架类型生成指定深度学习模型;/n根据所述指定深度学习模型的模型结构对所述指定深度学习模型进行训练。/n

【技术特征摘要】
1.一种深度学习模型构建方法,其特征在于,所述方法包括:
确定深度学习模型的框架类型;
基于对深度学习模型的多个操作组件的操作指令生成有向无环图;
基于所述有向无环图和所述框架类型生成指定深度学习模型;
根据所述指定深度学习模型的模型结构对所述指定深度学习模型进行训练。


2.根据权利要求1所述的方法,其特征在于,所述操作指令包括点击和拖拽,所述基于对深度学习模型的操作组件的操作指令生成有向无环图,包括:
监听对所述多个操作组件的点击事件,在所述点击事件触发时获取所述多个操作组件的配置参数;
监听所述多个操作组件的拖曳事件,在所述多个操作组件触发拖曳事件时获取所述多个操作组件的节点并计算所有所述节点的父子关系;
基于所述父子关系和连线操作在所述多个操作组件之间添加连线,以生成所述有向无环图。


3.根据权利要求1或2所述的方法,其特征在于,在所述基于对深度学习模型的多个操作组件的操作指令生成有向无环图之前,所述方法还包括:
采用图可视化编辑器生成所述深度学习模型中的操作对应的所述多个操作组件。


4.根据权利要求3所述的方法,其特征在于,所述采用图可视化编辑器生成所述深度学习模型中的操作对应的所述多个操作组件,包括:
通过所述图可视化编辑器注册canvas事件;
采用所述图可视化编辑器绘制所述多个操作组件中每个操作组件对应的图标;
对所述图标注册拖曳监听事件,以在所述图标的拖曳事件触发所述拖曳监听事件时触发所述canvas事件;
在所述canvas事件被触发时,通过所述图可视化编辑器的addModel添加所述多个操作组件;
采用所述图可视化编辑器的点击监听事件监听所述多个操作组件的点击操作,在所述点击监听事件触发时获取模型参数标签进行渲染,所述模型参数标签用于表示操作组件的配置参数。


5.根据权利要求2所述的方法,其特征在于,所述基于所述有向无环图和所述框架类型生成指定深度学习模型,包括:
基于所述框架类型导入框架包,所述框架包包括所述框架类型的深度学习模型的操作组件结构;
根据...

【专利技术属性】
技术研发人员:王小东周智杰吕文勇刘洪江廖浩
申请(专利权)人:成都新希望金融信息有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1