一种面向大规模语言模型的深度学习模型训练方法及系统技术方案

技术编号：38619197 阅读：18 留言：0更新日期：2023-08-31 18:24

本发明专利技术提供一种面向大规模语言模型的深度学习模型训练方法及系统。所述面向大规模语言模型的深度学习模型训练方法，包括以下步骤：S1、将面向大规模语言模型的有关训练数据导入到文件服务器中，训练服务器中预安装训练环境；S2、在显示有控制界面的显示终端进行预测试，并得出预测试成绩。本发明专利技术提供的面向大规模语言模型的深度学习模型训练方法，在学习过程中，通过进行预测试，并根据预测试成绩，训练服务器能够从文件服务器中调用预先导入在所述文件服务器中的训练数据，生成对应的训练模型，从而对于有一些基础的而又没有学习数据的学者，能够使其快速对应学习，不仅提高了适用性，而且降低了学习语言的用时，从而提高了学习语言的效率。学习语言的效率。学习语言的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向大规模语言模型的深度学习模型训练方法及系统

[0001]本专利技术涉及语言学习
，尤其涉及一种面向大规模语言模型的深度学习模型训练方法及系统。

技术介绍

[0002]深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本等数据。在语言学习时，也能够通过深度学习模型的训练流程，按照以往经验，一个深度学习模型的训练流程包括经过以下步骤：编写代码，安装环境，本地试运行，服务器运行，服务器代码调参，跟踪训练结果。
[0003]目前的深度学习模型的训练方式一般是从头学习或根据以往的学习数据来适配学习内容，但是对于有一些有学习基础而又没有学习数据的学生，导致其无法快速适配对应的学习内容进行学习，不仅适用性差，而且学习语言的效率低。
[0004]因此，有必要提供一种新的面向大规模语言模型的深度学习模型训练方法及系统解决上述技术问题。

技术实现思路

[0005]为解决上述技术问题，本专利技术提供一种面向大规模语言模型的深度学习模型训练方法及系统，在学习过程中，通过进行预测试，并根据预测试成绩，训练服务器能够从文件服务器中调用预先导入在所述文件服务器中的训练数据，生成对应的训练模型，从而对于有一些基础的而又没有学习数据的学者，能够使其快速对应学习，不仅提高了适用性，而且降低了学习语言的用时，从而提高了学习语言的效率。
[0006]本专利技术提供的面向大规模语言模型的深度学习模型训练方法及系统，包括以下...

【技术保护点】

【技术特征摘要】
1.一种面向大规模语言模型的深度学习模型训练方法，其特征在于，包括以下步骤：S1、将面向大规模语言模型的有关训练数据导入到文件服务器中，训练服务器中预安装训练环境；S2、在显示有控制界面的显示终端显示对应语言学习的预置试题，进行预测试，并得出预测试成绩，预测试成绩通过消息队列接收的方式传入到所述训练服务器；S3、根据得出的预测试成绩对应成绩划分等级，训练服务器从文件服务器中调用预先导入在所述文件服务器中的训练数据，生成对应等级的预置训练模型，在显示终端进行训练；S4、训练完成后，在显示终端对训练成果进行测试，得出测试成绩，并判断是否合格，不合格则重新进行训练。2.根据权利要求1所述的面向大规模语言模型的深度学习模型训练方法及系统，其特征在于，所述深度学习模型训练过程所产生的训练数据储存在所述文件服务器中。3.根据权利要求2所述的面向大规模语言模型的深度学习模型训练方法及系统，其特征在于，所述文件服务器通过所述控制界面显示所述训练数据。4.根据权利要求1所述的面向大规模语言模型的深度学习模型训练方法及系统，其特征在于，所述控制界面还包括训练参数调整选项，调整参数通...

【专利技术属性】
技术研发人员：杨娟，王博，于政，翟士丹，
申请(专利权)人：北京海致星图科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人