【技术实现步骤摘要】
机器翻译模型的自动训练方法、平台、电子设备、及存储介质
本公开实施例涉及自然语言处理
,具体涉及一种机器翻译模型的自动训练方法、平台、电子设备、及存储介质。
技术介绍
机器翻译模型的训练过程至少需要对样本数据经过数据清洗(例如脏字符剔除,标点规范化,脏数据剔除等)、数据预处理(如中文分词、日文分词等)、模型训练、机器自动评估(效果)、人工评估、模型上线等。通常,每个翻译环节都需要很多人工设置,要求模型训练人员的有较高的专业水平,另外,训练过程中各环节一般独立运行,需要模型训练人员执行的操作过多,不能顺畅地一键操作。
技术实现思路
有鉴于此,本公开实施例提供一种机器翻译模型的自动训练方法、平台、电子设备、及存储介质,以实现机器翻译过程的可视化控制和便捷化控制。本公开实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开实施例的实践而习得。在本公开的第一方面,本公开实施例提供了一种机器翻译模型的自动训练方法,包括:将至少一个翻译环节进行可视化展示; ...
【技术保护点】
1.一种机器翻译模型的自动训练方法,其特征在于,包括;/n将至少一个翻译环节进行可视化展示;/n获取用户输入的针对待训练目标模型的训练指令;/n根据所述训练指令确定至少一个待执行翻译环节和配置信息,获取所述至少一个待执行翻译环节的脚本文件,并将所获取的脚本文件根据所述配置信息进行参数配置后关联在一起;/n运行关联后的脚本文件,以训练所述目标模型。/n
【技术特征摘要】 【专利技术属性】
1.一种机器翻译模型的自动训练方法,其特征在于,包括;
将至少一个翻译环节进行可视化展示;
获取用户输入的针对待训练目标模型的训练指令;
根据所述训练指令确定至少一个待执行翻译环节和配置信息,获取所述至少一个待执行翻译环节的脚本文件,并将所获取的脚本文件根据所述配置信息进行参数配置后关联在一起;
运行关联后的脚本文件,以训练所述目标模型。
2.根据权利要求1所述的自动训练方法,其特征在于,获取所述至少一个待执行翻译环节的脚本文件,并将所获取的脚本文件根据所述配置信息进行参数配置后关联在一起包括:
执行预定脚本以执行如下操作:
根据预定命名规则和预定路径规则,取出各待执行翻译环节的脚本文件;
获取所述目标模型的训练流程对应的关联规则,将所取出的脚本文件根据所述配置信息进行参数配置后,将配置后的所述脚本文件根据所述关联规则关联在一起。
3.根据权利要求2所述的自动训练方法,其特征在于,所述方法还包括:在运行关联后的脚本文件的过程中,将产生的中间文件和结果文件根据所述预定命名规则进行命名,并根据所述预定路径规则进行存储。
4.根据权利要求3所述的自动训练方法,其特征在于,各翻译环节的脚本文件、中间文件和结果文件基于分布式文件系统存储。
5.根据权利要求1所述的自动训练方法,其特征在于,所述将至少一个翻译环节进行可视化展示包括:
将各翻译环节的名称和各翻译环节之间的顺序信息进行展示。
6.根据权利要求5所述的自动训练方法,其特征在于,所述将至少一个翻译环节进行可视化展示还包括:
展示各翻译环节的核心关联文件的映射接口和/或核心关联文件夹的资源映射接口;
所述方法还包括:
从所述核心关联文件的映射接口接收用户的可视化操作指令后,打开所述可视化操作指令对应的核心关联文件;
从所述核心关联文件夹的资源映射接口接收用户的可视化操作指令后,打开所述可视化操作指令对应的核心关联文件夹,以呈现所述核心关联文件夹内部的文件和/或子文件夹。
7.根据权利要5所述的自动训练方法,其特征在于,所述将至少一个翻译环节进行可视化展示还包括:
技术研发人员:赵程绮,李磊,周浩,王明轩,潘骁,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。