【技术实现步骤摘要】
对机器学习模型训练的方法和装置
[0001]本申请涉及人工智能领域,特别涉及一种对机器学习模型训练的方法、装置。
技术介绍
[0002]图像识别是机器学习的应用方向之一,基于机器学习模型的图像识别技术被广泛运用在人们的生产和生活中,主要应用于人脸识别、文档识别、场景识别等领域。在将机器学习模型投入应用之前,需要对机器学习模型进行训练。
[0003]目前,机器学习模型的训练过程需要使用提前标注好的样本数据,这些样本数据一般是由人工标注的。
[0004]然而,机器学习模型的训练过程需要使用大量的样本数据,标注这些样本数据耗费了大量的人力和时间。
技术实现思路
[0005]本申请提供了一种对机器学习模型训练的方法和装置,能够减少现有技术中标注样本数据耗费的大量人力和时间。
[0006]第一方面,提供了一种对机器学习模型训练的方法,所述方法包括:获取第一样本图像、第二样本图像和所述第二样本图像对应的基准识别结果;对所述第一样本图像进行图像变化处理得到第三样本图像;基于待训练的图像字符识别模型和 ...
【技术保护点】
【技术特征摘要】
1.一种对机器学习模型训练的方法,其特征在于,所述方法包括:获取第一样本图像、第二样本图像和所述第二样本图像对应的基准识别结果;对所述第一样本图像进行图像变化处理得到第三样本图像;基于待训练的图像字符识别模型和所述第一样本图像,确定第一识别结果,基于所述待训练的图像字符识别模型和所述第二样本图像,确定第二识别结果,基于所述待训练的图像字符识别模型和所述第三样本图像,确定第三识别结果;基于所述第一识别结果、所述第二识别结果、所述第三识别结果和所述基准识别结果,对所述待训练的图像字符识别模型进行参数调整。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一识别结果、所述第二识别结果、所述第三识别结果和所述基准识别结果,对所述待训练的图像字符识别模型进行参数调整,包括:基于所述第二识别结果和所述基准识别结果确定第一损失值,基于所述第三识别结果和所述第一识别结果确定第二损失值;基于所述第一损失值和所述第二损失值,对所述待训练的图像字符识别模型进行参数调整。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一损失值和所述第二损失值,对所述待训练的图像字符识别模型进行参数调整,包括:基于第一权重值和第二权重值,对所述第一损失值和所述第二损失值进行加权求和处理得到第三损失值;基于所述第三损失值,对所述待训练的图像字符识别模型进行参数调整。4.根据权利要求3所述的方法,其特征在于,所述第一权重值小于所述第二权重值。5.根据权利要求1所述的方法,其特征在于,所述基于待训练的图像字符识别模型和所述第一样本图像,确定第一识别结果,包括:获取在所述图像字符识别模型的历史训练过程中记录的至少一组模型参数;基于待训练的图像字符识别模型和所述至少一组模型参数对应的图像字符识别模型,分别对所述第一样本图像进行字符识别,得到多个待选识别结果和每个待选识别结果中每个字符对应的置信度;基于所述多个待选识别结果和每个待选识别结果中每个字符对应的置信度,在所述多个待选识别结果中选取第一识别结果。6.根据权利要求5所述的方法,其特征在于,所述基于所...
【专利技术属性】
技术研发人员:姜仟艺,宋祺,张睿,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。