调试深度神经网络制造技术

技术编号：26033844 阅读：45 留言：0更新日期：2020-10-23 21:11

调试深度神经网络。提供了用于调试深度神经网络的方法、计算机系统和计算机程序产品。本发明专利技术可包括自动识别与深度学习DL模型设计/代码相关联的一个或多个调试层，其中所识别的一个或多个调试层包括一个或多个错误，其中对于所识别的一个或多个调试层引入反向操作。然后，本发明专利技术可包括基于至少一个中断条件向用户呈现调试输出，其中响应于确定满足至少一个中断条件，触发要呈现给用户的调试输出，其中所呈现的调试输出包括对DL模型设计/代码中的所识别的一个或多个调试层的修复以及至少一个可行的洞察。

全部详细技术资料下载

【技术实现步骤摘要】
调试深度神经网络
本专利技术总体上涉及计算领域，并且更具体地涉及通用编程集成开发环境(IDE)。
技术介绍
深度神经网络已经在计算机视觉和图像处理、自然语言处理(NLP)和语音任务中变得无处不在。尽管深度神经网络可能胜过大多数其他问题解决技术，但训练深度神经网络可能被认为是困难的过程，对于经验不足的用户，其难度非线性地增加。诸如权重初始化、学习率和动量之类的因素可能会极大地影响训练过程，在该训练过程中，即使在定义这些超参数中的任意超参数时的小故障也可能导致网络学习的次优权重。
技术实现思路
本专利技术的实施例公开了一种用于调试(debug)深度神经网络的方法、计算机系统和计算机程序产品。本专利技术可包括自动识别与深度学习DL模型设计/代码相关联的一个或多个调试层，其中所识别的一个或多个调试层包括一个或多个错误，其中对于所识别的一个或多个调试层引入反向操作。然后，本专利技术可以包括基于至少一个中断条件向用户呈现调试输出，其中响应于确定满足所述至少一个中断条件，触发要呈现给用户的调试输出，其中所呈现的调试输出包括对DL模型设计/代码中所识别的一个或多个调试层的修复以及至少一个可行的洞察(insight)。附图说明通过下面结合附图理解的对示例性实施例的详细描述，本专利技术的这些和其他目的、特征和优点将变得明显。附图的各种特征未按比例绘制，因为图示是为了清楚起见，以帮助本领域技术人员结合详细描述来理解本专利技术。在附图中：图1示出根据至少一个实施例的联网计算机环境；...

【技术保护点】
1.一种计算机实现的方法，包括：/n自动识别与深度学习DL模型设计/代码相关联的一个或多个调试层，/n其中所识别的一个或多个调试层包括一个或多个错误，/n其中对于所识别的一个或多个调试层引入反向操作；以及/n基于至少一个中断条件向用户呈现调试输出，/n其中响应于确定满足所述至少一个中断条件，触发要呈现给用户的调试输出，/n其中所呈现的调试输出包括对在所述DL模型设计/代码中识别的一个或多个调试层的修复以及至少一个可行的洞察。/n

【技术特征摘要】
20190410 US 16/380,4371.一种计算机实现的方法，包括：
自动识别与深度学习DL模型设计/代码相关联的一个或多个调试层，
其中所识别的一个或多个调试层包括一个或多个错误，
其中对于所识别的一个或多个调试层引入反向操作；以及
基于至少一个中断条件向用户呈现调试输出，
其中响应于确定满足所述至少一个中断条件，触发要呈现给用户的调试输出，
其中所呈现的调试输出包括对在所述DL模型设计/代码中识别的一个或多个调试层的修复以及至少一个可行的洞察。

2.根据权利要求1所述的方法，其中自动识别所述深度学习DL模型设计/代码中的一个或多个层以用于调试还包括：
接收所述DL模型设计/代码以及与接收到的DL模型设计/代码相关联的训练数据；
在接收到的DL模型设计/代码中搜索一个或多个全局调试标志；
在接收到的DL模型设计/代码中识别一个或多个全局调试标志，
其中所识别的一个或多个全局调试标志的存在指示接收到的DL模型设计/代码应开始调试；
响应于确定推荐对接收到的DL模型设计/代码进行调试，从接收到的训练数据创建调试集和较小训练集；以及
为接收到的DL模型设计/代码选择所述至少一个中断条件，
其中所选择的所述至少一个中断条件确定呈现给用户的调试输出。

3.根据权利要求2所述的方法，还包括：
响应于确定存在标准任务和模型架构，根据知识库自动标记所识别的一个或多个调试层，
其中所述知识库包括与具有标准任务的先前训练的标准模型架构相关联的多个先前训练数据，
其中每个先前训练的标准模型架构包括具有调试标记的先前识别的调试层的列表。

4.根据权利要求2所述的方法，还包括：
响应于确定与接收到的DL模型设计/代码相关联的非标准任务和/或模型架构，基于与接收到的训练数据相关联的所创建的调试集和较小训练集来训练接收到的DL模型设计/代码；
根据所训练的DL模型设计/代码的所标记的一个或多个调试层来计算与每个调试层相关联的两组给定权重，
其中所计算的第一组给定权重与针对来自所训练的DL模型设计/代码的所标记的一个或多个调试层中的每个调试层的所创建的调试集相关联，所计算的第二组给定权重与针对来自所训练的DL模型设计/代码...

【专利技术属性】
技术研发人员：R·阿拉里卡特，S·G·塔米尔瑟尔瓦姆，S·克哈瑞，N·潘瓦尔，A·桑卡兰，S·K·K·玛尼，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人