机器学习平台中的文本处理方法、装置及设备制造方法及图纸

技术编号:32430205 阅读:24 留言:0更新日期:2022-02-24 18:40
本公开实施例公开了一种机器学习平台中的文本数据处理方法、装置及设备,该方法包括:将训练文本数据及其对应的真实标签输入至文本处理模型训练算子中,以训练出文本处理模型;将所述文本处理模型和预测文本数据输入至文本处理模型预测算子中,获得所述预测文本数据的预测标签;将所述预测标签和对应于所述预测文本数据的真实标签输入至文本处理模型评估算子中,获得所述文本处理模型的评估指标值;以及,根据所述评估指标值,对所述文本处理模型进行相应处理。模型进行相应处理。模型进行相应处理。

【技术实现步骤摘要】
机器学习平台中的文本处理方法、装置及设备


[0001]本专利技术涉及信息处理领域,更具体地,涉及一种机器学习平台的文本数据处理方法、一种机器学习平台的文本处理装置、一种包括至少一个计算装置和至少一个存储装置的设备及一种计算机可读存储介质。

技术介绍

[0002]随着人工智能的发展,数据的价值不断凸显,将文本数据中的有用信息抽取出来进行利用的需求越来越常见。
[0003]现有技术中,其往往是利用机器学习模型抽取文本数据中的有用信息,然而,其需要的是自然语言处理(Natural Langunge Possns,NLP)相关专业人员,缺少NLP相关经验的人员是很难完成的,同时,现有的自动机器学习工具功能过于简单片面,不能覆盖机器学习模型构建及应用的整个流程,即,无法有效地实现机器学习模型的后续生产和应用,从而导致无法将从文本数据中抽取出的有用信息进行快速应用。

技术实现思路

[0004]本公开实施例的一个目的是提供一种机器学习平台中的文本数据处理的新的技术方案。
[0005]根据本公开的第一方面,提供了一种机器学习平台本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种机器学习平台中的文本数据处理方法,包括:将训练文本数据及其对应的真实标签输入至文本处理模型训练算子中,以训练出文本处理模型;将所述文本处理模型和预测文本数据输入至文本处理模型预测算子中,获得所述预测文本数据的预测标签;将所述预测标签和对应于所述预测文本数据的真实标签输入至文本处理模型评估算子中,获得所述文本处理模型的评估指标值;以及,根据所述评估指标值,对所述文本处理模型进行相应处理。2.根据权利要求1所述的方法,其中,所述文本处理模型为文本分类模型,所述真实标签和预测标签为文本分类结果,所述文本处理模型训练算子为文本分类模型训练算子,所述文本处理模型预测算子为文本分类模型预测算子,所述文本处理模型评估算子为文本分类模型评估算子;或者,所述文本处理模型为实体抽取模型,所述真实标签和预测标签为实体信息结果,所述文本处理模型训练算子为实体抽取模型训练算子,所述文本处理模型预测算子为实体抽取模型预测算子,所述文本处理模型评估算子为实体抽取模型评估算子;或者所述文本处理模型为关系抽取模型,所述真实标签和预测标签为实体关系结果,所述本处理模型训练算子为关系抽取模型训练算子,所述文本处理模型预测算子为关系抽取模型预测算子,所述文本处理模型评估算子为关系抽取模型评估算子。3.根据权利要求1所述的方法,其中,所述方法还包括基于获取到的初始文本数据获得所述训练文本数据和所述预测文本数据的步骤,所述基于获取到的初始文本数据获得所述训练文本数据和所述预测文本数据的步骤,包括:将获取到的所述初始文本数据输入至文本数据拆分算子中,以将所述初始文本数据拆分为训练文本数据和预测文本数据;其中,所述训练文本数据作为所述文本处理模型训练算子的输入,所述预测文本数据作为所述文本处理模型预测算子的输入。4.根据权利要求3所述的方法,其中,获取所述历史文本数据,包括:提供至少一个数据导入路径;从选择的数据导入路径导入所述历史文本数据;以及,保存导...

【专利技术属性】
技术研发人员:陶冶陈伟周安谢佳雨
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1