基于XML的神经网络模型生成方法、设备和存储介质技术

技术编号:33533593 阅读:34 留言:0更新日期:2022-05-19 02:09
本发明专利技术提供一种基于XML的神经网络模型生成方法、设备和存储介质,其中方法包括:获取待解析的XML实例文本,所述XML实例文本中定义有深度学习框架属性及其深度学习框架属性值;对所述XML实例文本进行解析,生成所述深度学习框架属性值对应的目标神经网络模型。本发明专利技术提供的方法、设备和存储介质,对于不同的深度学习框架,只需修改深度学习框架属性值即可,该XML实例文本可兼容多种深度学习框架,无需用户针对每一种深度学习框架,设计、实现和调试自己特有的模型,从而大大降低了神经网络模型的生成工作量。的生成工作量。的生成工作量。

【技术实现步骤摘要】
基于XML的神经网络模型生成方法、设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于XML的神经网络模型生成方法、设备和存储介质。

技术介绍

[0002]随着深度学习技术的快速发展,TensorFlow、Pytorch、PaddlePaddle等深度学习框架不断涌现和发展。而这些深度学习框架的设计模式、特性、用法及其基础支持库大多不相同。
[0003]而不同深度学习框架之间存在的差异,就需要研究人员和工程人员投入大量时间学习不同深度学习框架的各种细节,才能生成各种深度学习框架所对应的神经网络模型,导致模型生成效率低;同时也带来了模型迁移难的问题,具体地,各个不同的深度学习框架开发的模型、算法无法互相兼容和迁移,严重制约了模型和算法的迁移效率与共享能力;而且,由于不同深度学习框架间的巨大差异,相同类型的模型与算法的性能,在不同深度学习框架上的表现也不一致,严重影响了科学监测、工业生产等领域的公正评测。
[0004]综上所述,基于当前主流的深度学习框架生成的神经网络模型,相互之间存在兼容性差的问题,导致模型本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于XML的神经网络模型生成方法,其特征在于,包括:获取待解析的XML实例文本,所述XML实例文本中定义有深度学习框架属性及其深度学习框架属性值;对所述XML实例文本进行解析,生成所述深度学习框架属性值对应的目标神经网络模型。2.根据权利要求1所述的基于XML的神经网络模型生成方法,其特征在于,所述对所述XML实例文本进行解析,生成所述深度学习框架属性值对应的目标神经网络模型,包括:基于所述XML实例文本中根元素的属性,进行初始化得到初始神经网络模型;确定所述根元素中当前待解析的第一目标子元素,并基于所述第一目标子元素的类型调用对应的解析算法对所述第一目标子元素进行解析,以更新所述初始神经网络模型;返回确定所述根元素中当前待解析的第一目标子元素的步骤,直至所述根元素中的所有子元素均解析完毕,并将最尾更新后的初始神经网络模型确定为所述目标神经网络模型。3.根据权利要求2所述的基于XML的神经网络模型生成方法,其特征在于,所述根元素包括超参数子元素,超参数子元素对应的解析算法的执行步骤如下所示:读取所述超参数子元素中超参数属性的属性值,并基于读取到的超参数属性的属性值,更新所述初始神经网络模型。4.根据权利要求2所述的基于XML的神经网络模型生成方法,其特征在于,所述根元素包括网络层子元素,网络层子元素对应的解析算法的执行步骤如下所示:读取所述网络层子元素中网络层属性的属性值,并基于读取到的网络层属性的属性值,构建待添加的目标神经网络层;将所述目标神经网络层添加至所述初始神经网络模型;其中,所述根元素还包括按元素操作层子元素,按元素操作层子元素对应的解析算法的执行步骤如下所示:读取所述按元素操作层子元素中按元素操作层属性的属性值,并基于读取到的按元素操作层属性的属性值,构建待添加的目标按元素操作层;将所述目标按元素操作层添加至所述初始神经网络模型。5.根据权利要求2所述的基于XML的神经网络模型生成方法,其特征在于,所述根元素包括块子元素,块子元素对应的解析算法的执行步骤如下所示:基于所述块...

【专利技术属性】
技术研发人员:高嘉欣廖名学晁永越李光耀梁媛媛吕品
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1