一种交互式机器学习实验展示方法及系统技术方案

技术编号:19178932 阅读:39 留言:0更新日期:2018-10-17 00:39
本发明专利技术公开了一种交互式机器学习实验展示方法及系统,属于计算机图形学技术领域。该方法及系统可以提高机器学习实验创建、调试和监控的便捷性,降低了机器学习的门槛,提高了开发效率。所述交互式机器学习实验展示方法包括:在网页上创建画布;从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;对所述画布区域中的节点数据进行训练,获得初始模型;对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。

An interactive machine learning experiment display method and system

The invention discloses an interactive machine learning experiment display method and system, belonging to the technical field of computer graphics. This method and system can improve the convenience of creating, debugging and monitoring machine learning experiments, reduce the threshold of machine learning, and improve the development efficiency. The interactive machine learning experiment display method includes: creating a canvas on a web page; selecting a component from the component list area and placing it in the canvas area; configuring the parameters of the component in the component configuration parameter area, reading the data, and completing the node setting; and selecting the node data in the canvas area. The initial model is obtained by training, and the final model is obtained by evaluating the initial model. If the evaluation result does not reach the preset goal, the parameter configuration data will be modified and evaluated after retraining.

【技术实现步骤摘要】
一种交互式机器学习实验展示方法及系统
本专利技术涉及计算机图形学
,特别地,涉及一种交互式机器学习实验展示方法及系统。
技术介绍
机器学习是人工智能的核心。机器学习主要研究如何利用算法让计算机模拟人的学习方式,自动分析数据获得新的知识。机器学习可以用来发现已有数据中的规律,进而预测未来的事件和行为等。机器学习的实现方式明显优于传统的商业智能形式。传统的机器学习主要使用StatisticalProductandServiceSolutions(对应中文:统计产品与服务解决方案,简称:SPSS),STATISTICALANALYSISSYSTEM(对应中文:统计分析系统,简称:SAS)等桌面软件,或R,Python等编程语言对数据进行离线处理和挖掘。然而,这种方式一方面对使用者的编程水平或软件的应用能力要求较高,另一方面往往只能离线处理少量数据。因此在大数据云计算时代,这种传统的机器学习在开发门槛、开发效率和部署重用等方面渐渐暴露出其弊端。为了简化使用机器学习的过程,便于开发人员、业务分析师和数据科学家进行广泛、便捷地应用,同时,有效利用云计算超大规模数据的处理和存储能力,很多公司纷纷在自己的云计算平台上推出基于Web的在线机器学习服务。其中有代表性的主要有阿里巴巴机器学习平台(PAI平台)和微软Azure机器学习工作室等。阿里和微软的机器学习平台是目前国内国外顶级水平。在他们的机器学习平台中均提供了基于Web的可视化操作界面。在这个界面中左侧是一些算法等组件,中间是实验画布,右侧是组件参数配置页。通过鼠标拖动节点到画布,然后拖动节点之间的端口可以完成机器学习实验流程图的创建,选择相应的组件可以在右侧配置组件的运行参数。配置完成后可以执行该实验。实验结束后,得到训练好的模型可保存并供其他机器学习实验使用;实验的处理流程也可以重复应用于新数据的分析和挖掘。现有的机器学习平台中的可视化操作界面在实时进度展现,实验流程控制和画布中流程图自动布局等方面尚有不足之处。
技术实现思路
本专利技术实施例提供一种交互式机器学习实验展示方法及系统,可以提高机器学习实验创建、调试和监控的便捷性,降低了机器学习的门槛,提高了开发效率。为解决上述技术问题,本专利技术实施例采用下述技术方案:第一方面,本专利技术实施例提供一种交互式机器学习实验展示方法,包括:在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;对所述画布区域中的节点数据进行训练,获得初始模型;对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。结合第一方面,作为第一种可实现的方案,所述的方法还包括进行自动布局,具体包括:将所述节点和节点之间的连线数据重新生成为图结构数据;调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标;清除画布区域中原有节点和连线;采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标。结合第一方面,作为第二种可实现的方案,所述的方法还包括运行进度显示,具体包括:所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边;使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数;根据所述偏移量,按照连线方向,将实线从连线起点向终点移动,其中,所述实线的长度等于偏移量;返回所述实时获取后端推送的进度数据步骤,直至完成运行。结合第一方面,作为第三种可实现的方案,所述的方法还包括暂停或者恢复节点运行,具体包括:接收指令,然后通过调度模块执行所述指令;所述指令包括暂停运行节点或者恢复运行节点。结合第一方面,作为第四种可实现的方案,所述获得初始模型,具体包括:从所述组件列表区域中选择训练组件至画布区域中,并进行参数配置,形成训练节点;连接待处理节点的出端口和所述训练节点的入端口;运行所述训练节点,完成训练,获得初始模型。结合第一方面,作为第五种可实现的方案,所述对初始模型进行评估,具体包括:从所述组件列表区域中选择模型评估组件至画布区域中,并进行参数配置,形成模型评估节点;连接所述初始模型的出端口和所述模型评估节点的入端口;运行所述模型评估节点。结合第一方面,作为第六种可实现的方案,所述的方法还包括对节点进行数据预处理,具体包括:从所述组件列表区域中选择数据预处理组件置于画布区域中,并进行参数配置,形成数据预处理节点;连接待处理节点的出端口和所述数据预处理节点的入端口;运行所述数据预处理节点,完成数据预处理。结合第一方面,作为第七种可实现的方案,所述的方法还包括对节点进行特征提取,具体包括:从所述组件列表区域中选择特征提取组件置于画布区域中,并进行参数配置,形成特征提取节点;连接待处理节点的出端口和所述特征提取节点的入端口;运行所述特征提取节点,完成特征提取。第二方面,本实施例还提供一种交互式机器学习实验展示系统,包括:创建模块:用于根据用户输入的创建信息,在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;节点设置模块:用于从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;训练模块:用于对所述画布区域中的节点数据进行训练,获得初始模型;模型评估模块:用于对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。结合第二方面,作为第一种可实现的方案,所述的系统还包括布局模块,用于对所述节点以及节点之间的连线进行重新布局;具体包括,第一生成子模块:用于将所述节点和节点之间的连线数据重新生成为图结构数据;第二生成子模块:用于调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标;第三生成子模块:用于清除画布区域中原有节点和连线,并采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标数据。结合第二方面,作为第二种可实现的方案,所述的系统还包括显示模块,用于显示运行进度;具体包括:第一计算子模块:用于在所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边;第二计算子模块:用于使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数;其中,所述进度百分数为增变量;显示子模块:用于根据所述偏移量,按照连线方向,将实线从连线起点向终点移动,其中,所述实线的长度等于偏移量。结合第二方面,作为第三种可实现的方案,所述的系统还包括调度模块,用于接收指令,并执行所述指令;所述指令包括暂停运行节点或者恢复运行节点。结合第二方面,作为第四种可实现的方案,所述的系统还包括预处理模块:用于对节点进行数据预处理,获得预处理后的节点;和/或,特征提取模块:用于从所述节点中提取特征数据。与现有技术相比,本专利技术交互式机器学习展示方法及系统,降低了机器学习的门槛,提高了开发效率。本专利技术在创建画布后,本文档来自技高网
...

【技术保护点】
1.一种交互式机器学习实验展示方法,其特征在于,包括:在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;对所述画布区域中的节点数据进行训练,获得初始模型;对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。

【技术特征摘要】
1.一种交互式机器学习实验展示方法,其特征在于,包括:在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;对所述画布区域中的节点数据进行训练,获得初始模型;对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。2.按照权利要求1所述的方法,其特征在于,还包括进行自动布局,具体包括:将所述节点和节点之间的连线数据重新生成为图结构数据;调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标;清除画布区域中原有节点和连线;采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标。3.按照权利要求1所述的方法,其特征在于,还包括运行进度显示,具体包括:所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边;使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数;根据所述偏移量,按照连线方向,将实线从连线起点向终点移动,其中,所述实线的长度等于偏移量;返回所述实时获取后端推送的进度数据步骤,直至完成运行。4.按照权利要求1所述的方法,其特征在于,还包括暂停或者恢复节点运行,具体包括:接收指令,然后通过调度模块执行所述指令;所述指令包括暂停运行节点或者恢复运行节点。5.按照权利要求1所述的方法,其特征在于,所述获得初始模型,具体包括:从所述组件列表区域中选择训练组件至画布区域中,并进行参数配置,形成训练节点;连接待处理节点的出端口和所述训练节点的入端口;运行所述训练节点,完成训练,获得初始模型。6.按照权利要求1所述的方法,其特征在于,所述对初始模型进行评估,具体包括:从所述组件列表区域中选择模型评估组件至画布区域中,并进行参数配置,形成模型评估节点;连接所述初始模型的出端口和所述模型评估节点的入端口;运行所述模型评估节点。7.按照权利要求1所述的方法,其特征在于,还包括对节点进行数据预处理,具体包括:从所述组件列表区域中选择数据预处理组件置于画布区域中,并进行参数配置,形成数据预处理节点;连接待处理节点的出端口和所述数据预处理节...

【专利技术属性】
技术研发人员:张天旭甄茂成周鹏程郝雷桑强代稳
申请(专利权)人:苏宁云商集团股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1