The present invention includes model training method and device, a machine learning based the method: according to the sampling probability of each sample collection samples, samples from the sample set, to generate the training set; using the training the training set, the training of machine learning model; to evaluate the trained machine learning model, to obtain the classification of the training focus on the accuracy of the sample of the training; the training of each sample, according to the classification accuracy, adjust the sampling probability; the sampling probability adjusted for the next generation once the training set. The method can adaptively adjust the sampling probability of each sample, improve the classification accuracy of important samples, and solve the problem that the neural network is not accurate enough for sample classification in the existing technology.
【技术实现步骤摘要】
基于机器学习的模型训练方法和装置
本专利技术涉及机器学习
,尤其涉及一种基于机器学习的模型训练方法和装置。
技术介绍
随着人工智能技术的发展,家电智能化逐渐成为一种发展趋势,用户对家电设备(比如洗衣机)的智能化需求越来越高,从而,通过图像、语音样本自动总结规律的深度学习技术开始应用于智能家电设备的研究中。相关深度学习技术中,在利用样本数据进行神经网络训练时,将各样本出现的概率看作是相同的,容易导致获得的神经网络对样本分类不够准确,出现部分分类准确性较高,而部分准确性较低的情况。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于机器学习的模型训练方法,以自适应调整各样本的抽样概率,进而提高重要样本的分类准确度,解决现有技术中神经网络对样本分类不够准确的问题。本专利技术的第二个目的在于提出一种基于机器学习的模型训练装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的,本专利技 ...
【技术保护点】
一种基于机器学习的模型训练方法,其特征在于,包括以下步骤:根据样本集合中各样本的抽样概率,从所述样本集合中抽取样本,以生成本次训练的训练集;采用所述本次训练的训练集,对机器学习模型进行训练;对训练后的机器学习模型进行评估,以得到所述本次训练的训练集中各样本的分类准确度;对所述本次训练的训练集中各样本,根据所述分类准确度,调整所述抽样概率;其中,调整后的抽样概率用于生成下一次训练的训练集。
【技术特征摘要】
1.一种基于机器学习的模型训练方法,其特征在于,包括以下步骤:根据样本集合中各样本的抽样概率,从所述样本集合中抽取样本,以生成本次训练的训练集;采用所述本次训练的训练集,对机器学习模型进行训练;对训练后的机器学习模型进行评估,以得到所述本次训练的训练集中各样本的分类准确度;对所述本次训练的训练集中各样本,根据所述分类准确度,调整所述抽样概率;其中,调整后的抽样概率用于生成下一次训练的训练集。2.根据权利要求1所述的基于机器学习的模型训练方法,其特征在于,所述根据所述分类准确度,调整所述抽样概率,包括:若所述分类准确度高于第一阈值,调低所述抽样概率;若所述分类准确度低于第二阈值,调高所述抽样概率。3.根据权利要求1所述的基于机器学习的模型训练方法,其特征在于,所述对训练后的机器学习模型进行评估,以得到所述本次训练的训练集中各样本的分类准确度,包括:针对所述本次训练的训练集中每一个样本,查询训练后的机器学习模型所生成的分类结果;将所述机器学习模型所生成的分类结果,与所述样本集合中所述样本的标签进行匹配;根据匹配程度,确定所述样本的分类准确度。4.根据权利要求1-3任一项所述的基于机器学习的模型训练方法,其特征在于,所述根据样本集合中各样本的抽样概率,从所述样本集合中抽取样本之前,还包括:统计所述样本集合中,与每一样本重复和/或相似的样本数量;根据统计得到的样本数量,确定所述样本的抽样概率。5.根据权利要求4所述的基于机器学习的模型训练方法,其特征在于,所述根据统计得到的样本数量,确定所述样本的抽样概率,包括:若统计得到的与所述样本重复和/或相似的样本数量高于第三阈值,在默认数值基础上调高,以确定所述样本的抽样概率;若统计得到的与所述样本重复和/或相似的样本数量低于第四阈值,在默认数值基础上调低,以确定所述样本的抽样概率。6.一种基于机器学习的模型训练装置,其特征在于,包括:生成模块,用于根据样本集合中各样本的抽样概率,从所述样本集合中抽取样本,以生成本次训练的训练集;训练模块,用于采用所述本次训练的训练集,对机器学习模型进行训练;评估模...
【专利技术属性】
技术研发人员:李俊,
申请(专利权)人:无锡小天鹅股份有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。