利用原型来操纵深度序列模型制造技术

技术编号:28843588 阅读:14 留言:0更新日期:2021-06-11 23:43
可以利用原型来操纵深度序列模型。显示原型概览,原型概览包括由模型通过反向传播学习的多个原型序列,原型序列中的每一个包括一系列事件,其中针对原型序列中的每一个,关于该模型对原型序列的使用来呈现统计性信息。接收调整原型序列中的一个或多个以微调该模型的输入。使用如所调整的多个原型序列来更新该模型以创建更新的模型。将如更新的模型显示在原型概览中。

【技术实现步骤摘要】
利用原型来操纵深度序列模型
本公开涉及利用原型来操纵深度序列模型。
技术介绍
在序列数据分析中采用了深度学习模型来帮助进行决策。诸如递归神经网络(RNN)之类的深度序列模型可以用于通过对电子健康记录(EHR)进行建模、分析文本的主题或情感、以及理解音频信号来预测患者状态。这样的技术已经在各种应用中实现了最先进的结果。尽管RNN的性能出色,但是RNN通常被视为“黑箱”。这是由于其复杂的架构以及模型权重的巨大规模。可解释性的这种缺乏限制了在许多关键决策场景中对RNN的采用,其中可能需要对预测背后的原因的理解。作为一个示例,欧盟最近的数据保护法规授予个体对机器学习系统所做出的决策的“解释权”(参见例如Voigt、Paul和AxelVondemBussche的“TheEUGeneralDataProtectionRegulation(GDPR)”,APracticalGuide,1stEd.,Cham:SpringerInternationalPublishing(2017))。除了可解释性之外,部署深度序列模型的另一个挑战是可操纵性。许多应用可以从支持领域专家利用其见解和领域知识来直接操纵模型中受益。例如,具有对心脏病的丰富经验的医生将获得有价值的知识,该有价值的知识可以使心力衰竭风险预测模型受益。尽管深度神经网络的端到端训练可以减轻手动管理数据特征的需要,但是单独的训练无法为专家用户提供用以操纵该模型的功能性。
技术实现思路
在一个或多个说明性示例中,描述了一种用于利用原型来操纵深度序列模型的方法。该方法包括:显示视觉界面,该视觉界面包括原型概览,该原型概览示出了模型通过反向传播学习的多个原型序列,原型序列中的每一个包括一系列事件,其中针对原型序列中的每一个,关于该模型对原型序列的使用来呈现统计性信息。该方法还包括:接收去往视觉界面的输入,该输入调整原型序列中的一个或多个以微调该模型;以及使用如所调整的多个原型序列来更新该模型以创建更新的模型。该方法进一步包括:在视觉界面中显示对如更新的模型所标识的多个原型序列的更新。在一个或多个说明性示例中,描述了一种用于利用原型来操纵深度序列模型的系统。该系统包括:显示设备;存储装置,其被配置成维持原型序列和模型;以及处理器,其与显示设备和存储装置进行通信。处理器被编程为显示视觉界面,该视觉界面包括原型概览,该原型概览示出了模型通过反向传播学习的多个原型序列,原型序列中的每一个包括一系列事件,其中针对原型序列中的每一个,关于该模型对原型序列的使用来呈现统计性信息。处理器还被编程为:接收去往视觉界面的输入,该输入调整原型序列中的一个或多个以微调该模型;使用如所调整的多个原型序列来更新该模型以创建更新的模型;以及在视觉界面中显示对如更新的模型所标识的多个原型序列的更新。附图说明图1图示了用于提供视觉界面以用于利用原型来操纵深度序列模型的系统的示例架构;图2A、图2B和图2C共同图示了该系统的视觉界面的示例;图3图示了该系统的视觉界面的原型概览的示例比较模式;图4图示了该系统的视觉界面的编辑图的示例细节;图5A和图5B共同图示了该系统的该视觉界面的序列查询/编辑小部件的示例细节;图6图示了用于在该系统中使用的模型的详细视图;以及图7图示了用于提供视觉界面以用于利用原型来操纵深度序列模型的示例过程。具体实施方式本文中描述了本公开的实施例。然而,应当理解的是,所公开的实施例仅是示例,并且其他实施例可以采取各种形式和替代形式。各图不一定是按比例的;一些特征可能被放大或最小化以示出特定组件的细节。因此,本文中所公开的具体结构和功能细节将不解释为限制性的,而是仅仅作为教导本领域技术人员以各种方式采用本实施例的代表性基础。如本领域普通技术人员将理解的,参考任一个附图而图示和描述的各种特征可以与在一个或多个其他附图中图示的特征组合,以产生未明确图示或描述的实施例。所图示特征的组合提供了典型应用的代表性实施例。然而,对于特定的应用或实现方式,可能期望与本公开的教导一致的特征的各种组合和修改。既可解释又可操纵的机器学习方法允许领域专家从该模型中获得见解,并且还利用其知识来完善该模型,从而创建互相受益的反馈环路。如本文中详细解释的,所描述的方法允许用户操纵序列学习模型而无需依赖于机器学习从业者(practitioner)作为媒介。所公开的概念利用序列学习模型,该序列学习模型组合了原型学习和深度神经网络,以用于可解释性和预测准确度两者。该模型的关键组成部分是使用历史数据来构造的示例案例的小集合(在本文中被称为原型)。可以设计交互式视觉界面以帮助各种应用领域中的专家来检查、批判和修正由该模型学习的序列原型。通过对模型进行这些修正,可以改进利用该模型的计算机系统的功能性。改进的视觉界面可以被配置成支持针对具有机器学习中的有限背景的最终用户的迭代模型完善。视觉界面提供了可视化和交互集合,以帮助最终用户来检查、批判和修正模型中的原型。特别地,视觉界面利用固有地可解释的主干深度序列模型。(关于这样的模型的进一步信息在出版物YaoMing、PanpanXu、HuaminQu和LiuRen的“InterpretableandSteerableSequenceLearningviaPrototypes”(Proceedingsofthe25ndACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining)中进行了描述,该出版物通过引用以其全部内容并入本文中。)该模型可以采用原型学习,这是基于案例的推论的一种形式。在这样做时,该模型利用了解决问题的过程,该解决问题的过程涉及咨询在过去的相似案例来针对新情形制定解决方案。特别地,该模型从原始训练数据中构造了原型序列的小集合。新的输入可以与编码器网络的隐空间中的原型进行比较,以用于预测输出。因此,所学习的原型给出了序列的简明总结,这是因为它们的数量通常比原始训练数据的规模小得多。在本文中详细讨论该模型的进一步方面及其使用。图1图示了用于提供视觉界面110以用于利用原型来操纵深度序列模型104的系统100的示例架构。如所示出的,系统100包括存储层102、服务层120和视觉界面110。应当注意的是,所图示的架构仅仅是一个示例,并且可以使用元件或元件组合的不同布局。存储层102可以被配置成维持模型104的历史快照。存储层102还可以维持包含训练/验证和测试数据的数据存储装置106,以支持增量模型104训练。存储层102还可以维持可以被查询和可视化的序列索引108。视觉界面110包含:丰富的可视化集合,用以支持模型104检查;以及一系列用户交互,用以支持对模型104的高效用户反馈。如下面详细讨论的,视觉界面110可以包括原型概览112、序列细节视图114、序列编码器视图116和原型编辑器118。原型编辑器118可以允许用户创建、更新和删除原型。服务层120可以包括模型本文档来自技高网...

【技术保护点】
1.一种用于利用原型来操纵深度序列模型的方法,包括:/n显示视觉界面,所述视觉界面包括原型概览,所述原型概览示出了模型通过反向传播学习的多个原型序列,原型序列中的每一个包括一系列事件,其中针对原型序列中的每一个,关于所述模型对原型序列的使用来呈现统计性信息;/n接收去往视觉界面的输入,所述输入调整原型序列中的一个或多个以微调所述模型;/n使用如所调整的多个原型序列来更新所述模型以创建更新的模型;以及/n在视觉界面中显示对如更新的模型所标识的多个原型序列的更新。/n

【技术特征摘要】
20191211 US 16/7110071.一种用于利用原型来操纵深度序列模型的方法,包括:
显示视觉界面,所述视觉界面包括原型概览,所述原型概览示出了模型通过反向传播学习的多个原型序列,原型序列中的每一个包括一系列事件,其中针对原型序列中的每一个,关于所述模型对原型序列的使用来呈现统计性信息;
接收去往视觉界面的输入,所述输入调整原型序列中的一个或多个以微调所述模型;
使用如所调整的多个原型序列来更新所述模型以创建更新的模型;以及
在视觉界面中显示对如更新的模型所标识的多个原型序列的更新。


2.根据权利要求1所述的方法,其中所述统计性信息包括权重列,所述权重列显示每个原型在确定所述模型的不同可能输出中的相对重要性。


3.根据权利要求1所述的方法,进一步包括:
针对一系列事件中的每个事件来计算相应事件重要性得分,相应事件重要性得分是使用留一法策略来计算的,其中从原型序列中移除相应事件,计算原型序列与其中移除了所述相应事件的原型序列之间的所述模型的隐空间中的距离,并且将所述距离归一化成指示从原型序列中移除所述事件的影响的事件重要性得分;以及
针对所述事件中的每一个在原型概览中显示相应事件重要性得分。


4.根据权利要求1所述的方法,进一步包括:
在视觉界面中将对所述模型的编辑历史显示为有向无环图,所述有向无环图中的每个节点表示所述模型的快照,所述有向无环图中的节点之间的每个链路指示在所述模型的快照之间执行的编辑,每个节点包括关于对所述模型的快照之间的多个原型序列执行的编辑的总结信息。


5.根据权利要求4所述的方法,进一步包括:
从所述有向无环图接收对第一模型和第二模型的选择;以及
在视觉界面中将第一模型与第二模型之间的改变可视化为更新的原型序列的邻域中的改变。


6.根据权利要求1所述的方法,进一步包括:
在视觉界面中显示序列细节视图,所述序列细节视图包括从原型概览中选择的原型序列的实例的邻域,所述邻域包括来自在距离上与所述模型的隐空间中的原型序列最接近的多个原型序列的原型序列。


7.根据权利要求1所述的方法,进一步包括:
在视觉界面中显示序列编码器视图,所述序列编码器视图对所述模型的编码器层的隐藏状态信息进行可视化,所述显示包括:使用降维将所述模型的隐藏状态向量投影到二维(2D)平面上,将所述多个原型序列中的原型序列的每个事件的隐藏状态投影到2D平面上,并且连接所述原型序列的事件以形成轨迹。


8.根据权利要求1所述的方法,进一步包括:
从视觉界面接收对所述多个原型序列之一的选择;
向视觉界面显示序列编辑器,所述序列编辑器被配置成接收用户输入,以从所述多个原型序列之一添加和移除事件;以及
响应于视觉界面接收到用户输入,从所述多个原型序列之一添加或移除事件中的一个或多个。


9.根据权利要求1所述的方法,进一步包括:
接收要在序列数据库中搜索的子序列的规范;
搜索序列数据库以标识具有包括所述子序列的最长共同子序列的序列;以及
响应于所述搜索而显示结果的排名列表。


10.根据权利要求1所述的方法,进一步包括:
经由视觉界面接收要在序列数据库中搜索的子序列的规范;
计算序列数据库中最频繁使用的n元语法的隐表示;
通过将所述子序列的隐表示与最频繁使用的n元语法的隐表示进行计算来搜索序列数据库;以及
响应于所述搜索而向视觉界面显示结果的排名列表,所述排名列表包含匹配的n元语法。


11.一种用于利用原型来操纵深度序列模型的系统,包括:
显示设备;
被配置成维持原型...

【专利技术属性】
技术研发人员:徐盼盼任骝明遥程富瑞屈华民
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1