对机器学习模型进行处理的方法及装置制造方法及图纸

技术编号：18895753 阅读：20 留言：0更新日期：2018-09-08 11:33

本发明专利技术实施例公开了一种对机器学习模型进行处理方法及装置，涉及互联网技术领域，能够提高基于机器学习模型的服务的实时性。本发明专利技术包括：通过机器学习平台运行训练实验，生成对应所述训练实验的模型文件，并根据所述模型文件创建预测实验；通过所述机器学习平台，获取所述预测实验对应的实验数据，所述实验数据包括：XML信息、所述预测实验所依赖的算法包；调用所述预测实验所依赖的算法包解析所述XML信息，并将所述解析结果加载至所述模型后，执行所述预测实验。本发明专利技术适用于实时性要求较强的机器学习模型服务。

Method and device for processing machine learning model

The embodiment of the invention discloses a processing method and a device for machine learning model, which relates to the technical field of Internet and can improve the real-time performance of the service based on machine learning model. The invention comprises: generating a model file corresponding to the training experiment by running the training experiment on the machine learning platform, and creating a prediction experiment according to the model file; obtaining the corresponding experimental data of the prediction experiment through the machine learning platform, the experimental data includes: XML information, the prediction experiment. The algorithm package on which the prediction experiment depends is invoked to parse the XML information and load the parsing result into the model to perform the prediction experiment. The invention is suitable for machine learning model service with strong real-time requirement.

全部详细技术资料下载

【技术实现步骤摘要】
对机器学习模型进行处理的方法及装置
本专利技术涉及互联网电子商务
，尤其涉及一种对机器学习模型进行处理的方法及装置。
技术介绍
随着互联网技术的发展，机器学习技术逐步应用在了各类在线业务中，目前最常用的领域，就是通过机器学习训练的模型，建立相应的应答机器人，以便于提高在线业务的自动化程度，从而提高业务系统的运营效率。目前，在机器学习模型的训练和部署过程中，业界传统的做法有如下：先将模型保存成pmml格式文件，再利用对应pmml格式文件的工具(比如JPMML)或自定义解析方法将pmml格式文件解析后进行实验。但是，由于需要依赖pmml的方式，这种方式要求算法代码必须满足特定的规范，规则复杂，导致了代码编写繁琐，需要按照特定格式\规范编写，且难以编写自定义的一些算法，费时费力，导致模型的开发效率很低，难以适应实时性要求越来越高的业务系统。
技术实现思路
本专利技术的实施例提供一种对机器学习模型进行处理方法及装置，能够提高基于机器学习模型的开发效率。为达到上述目的，本专利技术的实施例采用如下技术方案：通过机器学习平台运行训练实验，生成对应所述训练实验的模型文件，并根据所述模型文件创建预测实验；通过所述机器学习平台，获取所述预测实验对应的实验数据，所述实验数据包括：XML信息、所述预测实验所依赖的算法包；调用所述预测实验所依赖的算法包解析所述XML信息，并将所述解析结果加载至所述模型后，执行所述预测实验。通过本实施例中的机器学习平台，实现了用于建立机器人的模型的自动化训练，尤其是通过训练实验实现了模型的实验准备，并自动提取相关的实验数据，再通过预测实验自动校验模...

【技术保护点】
1.一种对机器学习模型进行处理方法，其特征在于，包括：通过机器学习平台运行训练实验，生成对应所述训练实验的模型文件，并根据所述模型文件创建预测实验，其中，所述模型文件被反序列化则得到模型，所述模型的父类具有对应所述预测实验的接口；通过所述机器学习平台，获取所述预测实验对应的实验数据，所述实验数据包括：XML信息、所述预测实验所依赖的算法包；调用所述预测实验所依赖的算法包解析所述XML信息，并将所述解析结果加载至所述模型后，执行所述预测实验。

【技术特征摘要】
1.一种对机器学习模型进行处理方法，其特征在于，包括：通过机器学习平台运行训练实验，生成对应所述训练实验的模型文件，并根据所述模型文件创建预测实验，其中，所述模型文件被反序列化则得到模型，所述模型的父类具有对应所述预测实验的接口；通过所述机器学习平台，获取所述预测实验对应的实验数据，所述实验数据包括：XML信息、所述预测实验所依赖的算法包；调用所述预测实验所依赖的算法包解析所述XML信息，并将所述解析结果加载至所述模型后，执行所述预测实验。2.根据权利要求1所述的方法，其特征在于，还包括：当所述模型通过所述预测实验时，发布所述模型，其中，所述模型用于在目标业务系统建立机器人。3.根据权利要求1所述的方法，其特征在于，所述XML信息中包括：所述预测实验执行的步骤流程，其中，每一个步骤对应一个job任务，每一个job任务包含所对应步骤的逻辑类和参数信息，前一个job任务的输出结果作为后一个job任务的输入。4.根据权利要求3所述的方法，其特征在于，所述将所述解析结果加载至所述模型后，执行所述预测实验，包括：调用所述预测实验所依赖的算法包，从所述XML信息中提取有源表，并输入job任务1；根据所述有源表和数据源的映射关系提取源数据，并转成弹性分布式数据集(RDD)，再根据转换得到的RDD执行所述job任务1，将所述job任务1的运行结果输出到目标表；重复上述过程，依次执行job任务2至job任务N，并将所述job任务2至所述job任务N的运行结果输出到目标表，N为大于且等于2的正整数。5.根据权利要求1所述的方法，其特征在于，所述根据所述有源表和数据源的映射关系提取源数据，包括：根据所述有源表和数据源的映射关系，从消息队列(MQ)提取所述源数据；job任务1至job任务N的运行结果通过MQ方式输出到所述目标表。6.根据权利要求1所述...

【专利技术属性】
技术研发人员：周鹏程，侯海涛，高祥友，代稳，
申请(专利权)人：苏宁易购集团股份有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人