模型构建方法、装置、存储介质及设备制造方法及图纸

技术编号：28035318 阅读：18 留言：0更新日期：2021-04-09 23:17

本发明专利技术提供的模型构建方法、装置、存储介质及处理器，获取线上数据；对所述线上数据进行众包标注，得到标注结果；所述标注结果包括：标注好的训练数据与标注情况信息；获取所述标注结果的标注质量；根据当前任务类型与所述标注结果的标注质量，选择相应的机器学习模型与相应的模型训练参数；利用所述标注好的训练数据，按照所述相应的模型训练参数，对所述相应的机器学习模型进行训练，得到训练好的预测模型。本发明专利技术将线上数据与建模配置过程相结合，实现模型与模型训练参数的自动化配置，充分降低了非专业人员的建模门槛，让整个建模过程变得有数据即可得到模型，提高了模型构建的便利性，同时也降低了建模人员的时间成本。

全部详细技术资料下载

【技术实现步骤摘要】
模型构建方法、装置、存储介质及设备
本专利技术涉及数据处理领域，更具体的说，涉及模型构建方法、装置、存储介质及设备。
技术介绍
可视化建模(VISUALMODELING)是利用围绕现实想法组织模型的一种思考问题的方法，它提供了一种从不同的视角来观察被开发系统的机制。当前市场已经孵化出了很多的可视化建模工具，但是，目前的建模工具都比较偏demo级别，通常都需要将主要建模工作交付给建模人员，以人工操作的方式来进行建模，建模过程非常繁琐、不便；在模型上线使用后，若线上数据发生变动，则还需要建模人员重新训练模型或对模型进行优化，以适应变化后的线上数据；当建模人员并不是特别专业时，很可能对模型的特征选取、参数设置等模型相关项不了解时，这也会给建模工作带来诸多阻碍与不便。因此，目前迫切需要一种切实有效的模型构建方案，以提高模型构建的便利性。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的模型构建方法、装置、存储介质及处理器。为实现上述目的，本专利技术提供如下技术方案：一种模型构建方法，包括：获取线上数据；对所述线上数据进行众包标注，得到标注结果；所述标注结果包括：标注好的训练数据与标注情况信息；获取所述标注结果的标注质量；根据当前任务类型与所述标注结果的标注质量，选择相应的机器学习模型与相应的模型训练参数；利用所述标注好的训练数据，按照所述相应的模型训练参数，对所述相应的机器学习模型进行训...

【技术保护点】
1.一种模型构建方法，其特征在于，包括：/n获取线上数据；/n对所述线上数据进行众包标注，得到标注结果；所述标注结果包括：标注好的训练数据与标注情况信息；/n获取所述标注结果的标注质量；/n根据当前任务类型与所述标注结果的标注质量，选择相应的机器学习模型与相应的模型训练参数；/n利用所述标注好的训练数据，按照所述相应的模型训练参数，对所述相应的机器学习模型进行训练，得到训练好的预测模型。/n

【技术特征摘要】
1.一种模型构建方法，其特征在于，包括：
获取线上数据；
对所述线上数据进行众包标注，得到标注结果；所述标注结果包括：标注好的训练数据与标注情况信息；
获取所述标注结果的标注质量；
根据当前任务类型与所述标注结果的标注质量，选择相应的机器学习模型与相应的模型训练参数；
利用所述标注好的训练数据，按照所述相应的模型训练参数，对所述相应的机器学习模型进行训练，得到训练好的预测模型。

2.如权利要求1所述的方法，其特征在于，所述获取所述标注结果的标注质量包括：
根据所述标注结果，获取各个标注人员的个人标注准确率与所有标注人员的整体标注准确率；
当有标注人员的个人标注准确率，低于所述整体标注准确率且与所述整体标注准确率的偏差大于预设偏差阈值时，获取个人标注准确率低于第一准确率阈值的部分标注人员的人数；
根据所述部分标注人员的人数，确定所述标注结果的标注质量。

3.如权利要求1或2所述的方法，其特征在于，在所述获取所述标注结果的标注质量之后，所述方法还包括：
根据所述标注结果的标注质量，对标注选取人数与一致回收人数的比例进行调整。

4.如权利要求1或2所述的方法，其特征在于，所述根据当前任务类型与所述标注结果的标注质量，选择相应的机器学习模型与相应的模型训练参数包括：
根据所述标注结果的标注质量，确定所述线上数据的标注难度；
根据当前任务类型与所述线上数据的标注难度，选择相应的机器学习模型与相应的模型训练参数。

5.如权利要求1所述的方法，其特征在于，在所述利用所述标注好的训练数据，按照所述相应的模型训练参数，对所述相应的机器学习模型进行训练，得到训练好的预测模型之后，所述方法还包括：
获取新线上数据；
对所述新线上数据进行众包标注，得到新标注结果；
利用所述训练好的预测模型对所述新线上数据进行预测，得到预测...

【专利技术属性】
技术研发人员：韩旭红，
申请(专利权)人：北京国双科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人