线上部署机器学习模型的方法、设备和存储介质技术

技术编号:20362520 阅读:23 留言:0更新日期:2019-02-16 16:22
本公开涉及用于线上部署机器学习模型的方法、设备和存储介质。所述方法包括:将离线的第一机器学习模型导出成第一xml文件;将第一xml文件导入到应用平台;在应用平台上将第一xml文件识别并解析成java类;以及使所述java类运行在应用平台上。通过本公开的各实施例,能够提供将机器学习模型部署到已运行的应用平台上的方案。

【技术实现步骤摘要】
线上部署机器学习模型的方法、设备和存储介质
本专利技术涉及计算机
,特别是涉及一种用于线上部署机器学习模型的方法、设备和存储介质。
技术介绍
很多应用平台上运行着各种机器学习模型,以满足业务需要。目前,在应用平台上部署机器学习模型的主要手段为离线部署,即,通过离线训练得到稳定的机器学习模型,在应用平台的系统版本发布的同时或在此之前将该机器学习模型集成在应用平台的系统版本中,而无法在应用平台已运行的状态下线上部署机器学习模型。
技术实现思路
为解决以上问题中的一个或多个,本专利技术实施例提供了一种用于线上部署机器学习模型的方法、设备和存储介质。根据本公开的第一方面,提供一种用于线上部署机器学习模型的方法,其包括:将离线的第一机器学习模型导出成第一xml文件;将第一xml文件导入到应用平台;在应用平台上将第一xml文件识别并解析成java类;以及使所述java类运行在应用平台上。根据一示例性实施例,所述将离线的第一机器学习模型导出成第一xml文件包括:将第一机器学习模型的类型及参数信息保存到xml格式文件的模型信息节点中;将第一机器学习模型的特征字段信息及结果字段信息保存到xml格式文件的数据字典节点中;将第一机器学习模型的特征数据所需的转换保存到xml格式文件的转换字典节点中;以及将所述模型信息节点、所述数据字典节点和所述转换字典节点均置于xml格式文件的根节点下,使所述模型信息节点、所述数据字典节点和所述转换字典节点成兄弟关系,从而形成第一xml文件,其中,第一xml文件符合PMML规范。根据一示例性实施例,所述在应用平台上将第一xml文件识别并解析成java类包括:将数据字典节点解析成DataDictionary类,用于保存特征字段与结果字段的名称及类型;将转换字典节点解析成TransformationDictionary类,用于保存关于DataDictionary类中哪些字段需要转换的信息并用于对要转换的字段执行相应的转换;将模型信息节点解析成Model类,用于执行机器学习模型的预算算法并返回预测结果。根据一示例性实施例,将模型信息节点解析成Model类包括:根据机器学习模型的类型确定预算算法并将该预算算法封装在Model类中。根据一示例性实施例,所述使所述java类运行在应用平台上包括:根据DataDictionary类中的特征字段信息确定第一机器学习模型所需要的标准特征数据,并获取与所述标准特征数据相对应的实时特征数据;通过TransformationDictionary类对所获取的实时特征数据执行所述相应的转换,以得到所需要的标准特征数据;以及通过Model类对所述标准特征数据执行预算算法以得到预测结果。根据一示例性实施例,所述方法还包括:将离线的第二机器学习模型导出成第二xml文件;将第二xml文件导入所述应用平台以替换第一xml文件;将第二xml文件识别并解析成java类并用其更新应用平台上运行的对应于第一xml文件的java类。根据本公开的第二方面,提供一种用于线上部署机器学习模型的装置,其包括:xml文件导出模块,其被配置为将离线的第一机器学习模型导出成第一xml文件;xml文件导入模块,其被配置为将第一xml文件导入到应用平台;xml文件解析模块,其被配置为在应用平台上将第一xml文件识别并解析成java类;以及运行模块,其被配置为使所述java类运行在应用平台上。根据一示例性实施例,所述xml文件导出模块包括:模型信息节点模块,其被配置为将第一机器学习模型的类型及参数信息保存到xml格式文件的模型信息节点中;数据字典节点模块,其被配置为将第一机器学习模型的特征字段信息及结果字段信息保存到xml格式文件的数据字典节点中;转换字典节点模块,其被配置为将第一机器学习模型的特征数据所需的转换保存到xml格式文件的转换字典节点中;以及根节点模块,其被配置为将所述模型信息节点、所述数据字典节点和所述转换字典节点均置于xml格式文件的根节点下,使所述模型信息节点、所述数据字典节点和所述转换字典节点成兄弟关系,从而形成第一xml文件。根据一示例性实施例,所述xml文件解析模块包括:数据字典节点解析模块,其被配置为:将数据字典节点解析成DataDictionary类,所述DataDictionary类用于保存特征字段与结果字段的名称及类型;转换字典节点解析模块,其被配置为:将转换字典节点解析成TransformationDictionary类,所述TransformationDictionary类用于保存关于DataDictionary类中哪些字段需要转换的信息并用于对要转换的字段执行相应的转换;模型信息节点解析模块,其被配置为:将模型信息节点解析成Model类,所述Model类用于执行机器学习模型的预算算法并返回预测结果。根据本公开的第三方面,提供一种计算设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令在被所述处理器执行时,使得所述处理器执行如上所述的方法实施例中的任一个。根据本公开的第四方面,提供一种存储介质,其上存储有计算机程序,所述计算机程序在被一个或多个处理器执行时实现如上所述的方法实施例中的任一个。本公开的实施例提供的技术方案可以包括以下有益效果:本公开如上所述以及如下所述的各实施例,通过将离线训练得到的机器学习模型导出成xml文件、在应用平台上将该xml文件自动识别和解析成java类、并使解析出的java类运行在应用平台上,方便快捷地实现了机器学习模型在应用平台上的线上部署。另外,本专利技术各实施例中的一个或多个通过使用从更新的机器学习模型导出的新xml文件替换应用平台上的旧xml文件来进行机器学习模型的线上更新,使得应用平台上运行的机器学习模型可以及时利用更新的数据,提高了机器学习模型的时效性,使其可以及时应对业务的变化,从而提升了机器学习模型的风险防控价值。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明图1是根据一示例性实施例示出的一种用于线上部署机器学习模型的方法的示意流程图。图2是根据图1对应实施例示出的用于线上部署机器学习模型的方法中步骤S110的一种示例性具体实现方式的示意流程图。图3是根据图1对应实施例示出的用于线上部署机器学习模型的方法中步骤S130的一种示例性具体实现方式的示意流程图。图4是根据图1对应实施例示出的用于线上部署机器学习模型的方法中步骤S140的一种示例性具体实现方式的示意流程图。图5是根据图1对应实施例示出的用于线上部署机器学习模型的方法中步骤S140之后的机器学习模型更新的示例性方法的示意流程图。图6是根据一示例性实施例示出的用于线上部署机器学习模型的装置的示意组成框图。图7是根据图6对应实施例示出的用于线上部署机器学习模型的装置的xml文件导出模块610的示例性实现方式的示意组成框图。图8是根据图6对应实施例示出的用于线上部署机器学习模型的装置的xml文件解析模块630的示例性实现方式的示意组成框图。图9是根据一示例性实施例示出的计算设备的示意组成框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术的示例性实施例进行进一步详细说明。本文档来自技高网...

【技术保护点】
1.一种用于线上部署机器学习模型的方法,其特征在于,包括:将离线的第一机器学习模型导出成第一xml文件;将第一xml文件导入到应用平台;在应用平台上将第一xml文件识别并解析成java类;以及使所述java类运行在应用平台上。

【技术特征摘要】
1.一种用于线上部署机器学习模型的方法,其特征在于,包括:将离线的第一机器学习模型导出成第一xml文件;将第一xml文件导入到应用平台;在应用平台上将第一xml文件识别并解析成java类;以及使所述java类运行在应用平台上。2.如权利要求1所述的方法,其特征在于,所述将离线的第一机器学习模型导出成第一xml文件包括:将第一机器学习模型的类型及参数信息保存到xml格式文件的模型信息节点中;将第一机器学习模型的特征字段信息及结果字段信息保存到xml格式文件的数据字典节点中;将第一机器学习模型的特征数据所需的转换保存到xml格式文件的转换字典节点中;以及将所述模型信息节点、所述数据字典节点和所述转换字典节点均置于xml格式文件的根节点下,使所述模型信息节点、所述数据字典节点和所述转换字典节点成兄弟关系,从而形成第一xml文件,其中,第一xml文件符合PMML规范。3.如权利要求2所述的方法,其特征在于,所述在应用平台上将第一xml文件识别并解析成java类包括:将数据字典节点解析成DataDictionary类,用于保存特征字段与结果字段的名称及类型;将转换字典节点解析成TransformationDictionary类,用于保存关于DataDictionary类中哪些字段需要转换的信息并用于对要转换的字段执行相应的转换;将模型信息节点解析成Model类,用于执行机器学习模型的预算算法并返回预测结果。4.如权利要求3所述的方法,其特征在于,将模型信息节点解析成Model类包括:根据机器学习模型的类型确定预算算法并将该预算算法封装在Model类中。5.如权利要求3所述的方法,其特征在于,所述使所述java类运行在应用平台上包括:根据DataDictionary类中的特征字段信息确定第一机器学习模型所需要的标准特征数据,并获取与所述标准特征数据相对应的实时特征数据;通过Transformation...

【专利技术属性】
技术研发人员:毕文智谢波
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1