【技术实现步骤摘要】
【国外来华专利技术】用于基于RNN的深度强化机器学习模型的动态用户界面的系统、方法和计算机程序产品
[0001]相关申请的交叉引用
[0002]本申请要求2020年4月30日提交的第63/017,907号美国临时专利申请的优先权,所述美国临时专利申请的公开内容以全文引用的方式并入本文中。
[0003]本公开大体上涉及用于机器学习的动态用户界面,且在特定实施例中涉及用于基于RNN的深度强化机器学习模型的动态用户界面的系统、方法和计算机程序产品。
技术介绍
[0004]深度强化学习的目标是训练自主代理与预定义环境交互,并努力通过深度神经网络(DNN)实现特定目标。基于递归神经网络(RNN)的深度学习模型是有益的,因为基于RNN的模型可以有效地捕获环境的时间演变并且用适当的代理动作进行响应。然而,即使考虑到这些性能益处,在基于RNN的模型如何在内部理解环境以及模型随时间的变化如何记忆方面还有更多的需要了解。这些细节对于领域专家了解并进一步改进模型极为重要,由于此类模型的高维内部数据表示,这在技术上是复杂的。
技术实现思路
/>[0005]根据本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于评估基于递归神经网络(RNN)的深度学习模型的计算机实施的方法,包括:利用至少一个处理器基于由基于RNN的深度学习模型生成的模型数据生成第一图形用户界面(GUI),所述模型数据包括与环境中的多个状态相关联的多个事件,所述第一GUI包括相对于基于所述多个事件和所述多个状态的至少一个参数值视觉上表示所述多个事件的时间线的图表;利用所述至少一个处理器生成第二GUI,所述第二GUI包括视觉上表示多维中间数据的二维投影的点图,基于所述基于RNN的深度学习模型中将所述多个状态中的至少一个状态连接到所述多个事件中的至少一个事件的变换之间的多维中间数据,所述点图的每个点表示时间步骤和所述时间步骤中的至少一个事件;以及利用所述至少一个处理器基于与所述第一GUI和所述第二GUI中的至少一个的用户交互而在时间步骤扰乱所述环境。2.根据权利要求1所述的计算机实施的方法,还包括:利用所述至少一个处理器基于所述基于RNN的深度学习模型的至少一个隐藏状态和/或单元状态生成第三GUI。3.根据权利要求2所述的计算机实施的方法,还包括:利用所述至少一个处理器从所述至少一个隐藏状态和/或单元状态中标识影响所述多个事件中的事件的隐藏状态和/或单元状态。4.根据权利要求2所述的计算机实施的方法,其中生成所述第三GUI包括在多个步骤的不同子集内生成对比分布的视觉表示。5.根据权利要求2所述的计算机实施的方法,其中生成所述第三GUI包括生成包括多个视觉表示的至少两行,所述多个视觉表示中的每个视觉针对所述模型的多个维度中的一个维度可视化隐藏状态和/或单元状态,其中所述至少两行中的第一行视觉上表示所述多个步骤的静态全局信息,并且其中所述至少两行中的第二行视觉上表示与所述第一GUI相关联的单个步骤的本地信息。6.根据权利要求1所述的计算机实施的方法,其中所述第一GUI和所述第二GUI包括在同一主GUI内的不同窗口。7.根据权利要求1所述的计算机实施的方法,还包括:利用所述至少一个处理器基于由扰乱所述环境产生的输出来更新所述第一GUI和所述第二GUI中的至少一个。8.根据权利要求1所述的计算机实施的方法,还包括:基于所述第一GUI和/或所述第二GUI下的数据,确定由所述基于RNN的深度学习模型生成的至少一个预测规则,其中所述至少一个预测规则包括至少一个条件和对所述至少一个条件的至少一个预测响应;以及通过以下操作验证所述基于RNN的深度学习模型实施所述至少一个预测规则:基于所述至少一个条件扰乱所述环境;以及基于所述至少一个预测响应分析所述基于RNN的深度学习模型对所述扰乱的响应。9.根据权利要求1所述的计算机实施的方法,还包括:利用所述至少一个处理器使用所述基于RNN的深度学习模型来训练第二深度学习模型。
10.根据权利要求1所述的计算机实施的方法,其中所述环境包括执行模拟事件的模拟器,其中所述多个事件和所述多个状态与所述模拟事件相关联。11.根据权利要求10所述的计算机实施的方法,其中所述模拟事件包括模拟电子支付欺诈确定事件。12.根据权利要求11所述的计算机实施的方法,其中扰乱所述环境包括将模拟电子支付交易提交给所述基于RNN的深度学习模型。13.根据权利要求1所述的计算机实施的方法,其中所述环境包括电子支付处理网络,其中所述多个事件包括与交易数据相关联的多个交易,并且其中所述多个状态中的每个状态包括以下中的至少一个:多个欺诈确定、多个退款、多个跨境交易或其任何组合。14.根据权利要求13所述的计算机实施的方法,其中所述模型数据是基于历史交易数据生成的,所述方法还包括:提取由所述基于RNN的深度学习模型生成的至少一个规则;以及由交易处理系统将所述至少一个规则应用于未来交易。15.根据权利要求13所述的计算机实施的方法,还包括:通过以下操作将所述基于RNN的深度学习模型与交易处理系统集成以处理与新交易相关联的新交易数据:利用所述基于RNN的深度学习模型评估所述新交易数据;以及利用所述基于RNN的深度学习模型确定所述新交易的状态。16.根据权利要求15所述的计算机实施的方法,还包括:响应于确定所述新交易的所述状态是欺诈状态而拒绝所述新交易。17.根据权利要求1所述的计算机实施的方法,其中所述参数值表示多个效应中的至少一个效应或所述多个状态中的至少一个状态。18.根据权利要求1所述的计算机实施的方法,其中所述基于RNN的深度学习模型是基于所述多个状态、所述多个事件,以及与所述多个状态中的至少一个状态和/或所述多个事件中的至少一个事件相关联的多个奖励。19.一种用于评估基于递归神经网络(RNN)的深度学习模型的系统,包括:至少一个数据存储装置,所述至少一个数据存储装置包括由基于RNN的深度学习模型生成的模型数据,所述模型数据包括与环境中的多个状态相关联的多个事件;至少一个处理器,所述至少一个处理器与所述至少一个数据存储装置通信,所述至少一个处理器被编程或配置成:基于所述模型数据生成第一图形用户界面(GUI),所述第一GUI包括相对于基于所述多个事件和所述多个状态的至少一个参数值视觉上表...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。