【技术实现步骤摘要】
利用原型来操纵深度序列模型
本公开涉及利用原型来操纵深度序列模型。
技术介绍
在序列数据分析中采用了深度学习模型来帮助进行决策。诸如递归神经网络(RNN)之类的深度序列模型可以用于通过对电子健康记录(EHR)进行建模、分析文本的主题或情感、以及理解音频信号来预测患者状态。这样的技术已经在各种应用中实现了最先进的结果。尽管RNN的性能出色,但是RNN通常被视为“黑箱”。这是由于其复杂的架构以及模型权重的巨大规模。可解释性的这种缺乏限制了在许多关键决策场景中对RNN的采用,其中可能需要对预测背后的原因的理解。作为一个示例,欧盟最近的数据保护法规授予个体对机器学习系统所做出的决策的“解释权”(参见例如Voigt、Paul和AxelVondemBussche的“TheEUGeneralDataProtectionRegulation(GDPR)”,APracticalGuide,1stEd.,Cham:SpringerInternationalPublishing(2017))。除了可解释性之外,部署深度序列模型的另一个挑战是可操纵性。许多应用可以从支持领域专家利用其见解和领域知识来直接操纵模型中受益。例如,具有对心脏病的丰富经验的医生将获得有价值的知识,该有价值的知识可以使心力衰竭风险预测模型受益。尽管深度神经网络的端到端训练可以减轻手动管理数据特征的需要,但是单独的训练无法为专家用户提供用以操纵该模型的功能性。
技术实现思路
在一个或多个说明性示例中,描述了一种用于利用原型来操纵深度序 ...
【技术保护点】
1.一种用于利用原型来操纵深度序列模型的方法,包括:/n显示视觉界面,所述视觉界面包括原型概览,所述原型概览示出了模型通过反向传播学习的多个原型序列,原型序列中的每一个包括一系列事件,其中针对原型序列中的每一个,关于所述模型对原型序列的使用来呈现统计性信息;/n接收去往视觉界面的输入,所述输入调整原型序列中的一个或多个以微调所述模型;/n使用如所调整的多个原型序列来更新所述模型以创建更新的模型;以及/n在视觉界面中显示对如更新的模型所标识的多个原型序列的更新。/n
【技术特征摘要】
20191211 US 16/7110071.一种用于利用原型来操纵深度序列模型的方法,包括:
显示视觉界面,所述视觉界面包括原型概览,所述原型概览示出了模型通过反向传播学习的多个原型序列,原型序列中的每一个包括一系列事件,其中针对原型序列中的每一个,关于所述模型对原型序列的使用来呈现统计性信息;
接收去往视觉界面的输入,所述输入调整原型序列中的一个或多个以微调所述模型;
使用如所调整的多个原型序列来更新所述模型以创建更新的模型;以及
在视觉界面中显示对如更新的模型所标识的多个原型序列的更新。
2.根据权利要求1所述的方法,其中所述统计性信息包括权重列,所述权重列显示每个原型在确定所述模型的不同可能输出中的相对重要性。
3.根据权利要求1所述的方法,进一步包括:
针对一系列事件中的每个事件来计算相应事件重要性得分,相应事件重要性得分是使用留一法策略来计算的,其中从原型序列中移除相应事件,计算原型序列与其中移除了所述相应事件的原型序列之间的所述模型的隐空间中的距离,并且将所述距离归一化成指示从原型序列中移除所述事件的影响的事件重要性得分;以及
针对所述事件中的每一个在原型概览中显示相应事件重要性得分。
4.根据权利要求1所述的方法,进一步包括:
在视觉界面中将对所述模型的编辑历史显示为有向无环图,所述有向无环图中的每个节点表示所述模型的快照,所述有向无环图中的节点之间的每个链路指示在所述模型的快照之间执行的编辑,每个节点包括关于对所述模型的快照之间的多个原型序列执行的编辑的总结信息。
5.根据权利要求4所述的方法,进一步包括:
从所述有向无环图接收对第一模型和第二模型的选择;以及
在视觉界面中将第一模型与第二模型之间的改变可视化为更新的原型序列的邻域中的改变。
6.根据权利要求1所述的方法,进一步包括:
在视觉界面中显示序列细节视图,所述序列细节视图包括从原型概览中选择的原型序列的实例的邻域,所述邻域包括来自在距离上与所述模型的隐空间中的原型序列最接近的多个原型序列的原型序列。
7.根据权利要求1所述的方法,进一步包括:
在视觉界面中显示序列编码器视图,所述序列编码器视图对所述模型的编码器层的隐藏状态信息进行可视化,所述显示包括:使用降维将所述模型的隐藏状态向量投影到二维(2D)平面上,将所述多个原型序列中的原型序列的每个事件的隐藏状态投影到2D平面上,并且连接所述原型序列的事件以形成轨迹。
8.根据权利要求1所述的方法,进一步包括:
从视觉界面接收对所述多个原型序列之一的选择;
向视觉界面显示序列编辑器,所述序列编辑器被配置成接收用户输入,以从所述多个原型序列之一添加和移除事件;以及
响应于视觉界面接收到用户输入,从所述多个原型序列之一添加或移除事件中的一个或多个。
9.根据权利要求1所述的方法,进一步包括:
接收要在序列数据库中搜索的子序列的规范;
搜索序列数据库以标识具有包括所述子序列的最长共同子序列的序列;以及
响应于所述搜索而显示结果的排名列表。
10.根据权利要求1所述的方法,进一步包括:
经由视觉界面接收要在序列数据库中搜索的子序列的规范;
计算序列数据库中最频繁使用的n元语法的隐表示;
通过将所述子序列的隐表示与最频繁使用的n元语法的隐表示进行计算来搜索序列数据库;以及
响应于所述搜索而向视觉界面显示结果的排名列表,所述排名列表包含匹配的n元语法。
11.一种用于利用原型来操纵深度序列模型的系统,包括:
显示设备;
被配置成维持原型...
【专利技术属性】
技术研发人员:徐盼盼,任骝,明遥,程富瑞,屈华民,
申请(专利权)人:罗伯特·博世有限公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。