分类模型的训练方法及计算机可读存储介质技术

技术编号:32558804 阅读:21 留言:0更新日期:2022-03-05 12:01
本发明专利技术提供了一种分类模型的训练方法,包括:根据第一数据集训练初始分类模型以得到中间分类模型,其中,第一数据集为有标签数据的集合;利用中间分类模型提取训练数据集的特征向量,其中,训练数据集包括第一数据集和第二数据集,第二数据集为无标签数据的集合;根据训练数据集的特征向量构建最近数据图和最远数据图;根据最近数据图和最远数据图获取第二数据集的预测标签;以及根据第一数据集和带有预测标签的第二数据集训练中间分类模型以得到目标分类模型。此外,本发明专利技术还提供了一种计算机可读存储介质。本发明专利技术技术方案有效解决了有标签数据的数量少导致分类模型准确度不高的问题。的问题。的问题。

【技术实现步骤摘要】
分类模型的训练方法及计算机可读存储介质


[0001]本专利技术涉及机器学习
,尤其涉及一种分类模型的训练方法及计算机可读存储介质。

技术介绍

[0002]深度学习模型在各个领域中已经取得了巨大的成就,特别是有监督学习算法在大量应用领域中取得了显著的效果。深度学习一般是从大量已标注的训练样本中学习一个模型用于给未见过的样本预测一个尽可能正确的标签。然而在许多实际应用场景中,人工标注大规模的训练样本需要耗费巨大的人力和物力。因此,许多研究聚焦于半监督学习,即在只有部分已标注样本和大量未标注样本的情况下学习的一个模型。

技术实现思路

[0003]本专利技术提供了一种分类模型的训练方法及计算机可读存储介质,用于解决有标签数据的数量少导致分类模型准确度不高的问题。
[0004]第一方面,本专利技术实施例提供一种分类模型的训练方法,所述分类模型的训练方法包括:根据第一数据集训练初始分类模型以得到中间分类模型,其中,所述第一数据集为有标签数据的集合;利用所述中间分类模型提取训练数据集的特征向量,其中,所述训练数据集包括所述第一数据集和第二数据集,所述第二数据集为无标签数据的集合;根据所述训练数据集的特征向量构建最近数据图和最远数据图,其中,所述最近数据图为在所述训练数据集中的每一数据与所述每一数据距离最近的多个其它数据的关系图,所述最远数据图为在所述训练数据集中的每一数据与所述每一数据距离最远的多个其它数据的关系图;根据所述最近数据图和所述最远数据图获取所述第二数据集的预测标签;以及根据所述第一数据集和带有所述预测标签的第二数据集训练所述中间分类模型以得到目标分类模型。
[0005]第二方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序指令,所述程序指令可被处理器执行以实现如上所述的分类模型的训练方法。
[0006]上述分类模型的训练方法及计算机可读存储介质,先根据有标签的第一数据集训练初始分类模型得到中间分类模型,使得到的中间分类模型获得一定的特征提取能力,方便后续提取数据的特征向量。其中,根据第一数据集训练初始分类模型的过程可以称为热启动阶段。利用中间分类模型提取第一数据集和第二数据集的特征向量,再根据特征向量构建最近数据图和最远数据图。根据最近数据图中每一数据与距离最近的多个其它数据的相似性和最远数据图中每一数据与距离最远的多个其它数据的不相似性,将第一数据集带
有的标签信息传播给第二数据集,从而得到第二数据集的预测标签。使得预测标签能够结合距离最近的数据的标签信息和距离最远的数据的标签信息,利用数据间的相似性和不相似性进行消歧,从而使得预测标签更加可信、更加精确。最后根据第一数据集和带有预测标签的第二数据集对中间分类模型进行训练,有效增加了有标签数据的数量,从而得到具有良好分类能力的目标分类模型,提高了目标分类模型的性能。
附图说明
[0007]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0008]图1为本专利技术实施例提供的分类模型的训练方法的流程图。
[0009]图2为本专利技术实施例提供的分类模型的训练方法的第一子流程图。
[0010]图3为本专利技术实施例提供的分类模型的训练方法的第二子流程图。
[0011]图4为本专利技术实施例提供的分类模型的训练方法的第三子流程图。
[0012]图5为图1所示的最近数据图的示意图。
[0013]图6为图1所示的最远数据图的示意图。
[0014]图7为图3所示的近邻相似度矩阵的示意图。
[0015]图8为图3所示的疏远相似度矩阵的示意图。
[0016]图9为图3所示的初始标签矩阵的示意图。
[0017]图10为图4所示的目标标签矩阵的示意图。
[0018]图11为本专利技术实施例提供的终端的内部结构示意图。
[0019]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0020]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的规划对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,换句话说,描述的实施例根据除了这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,还可以包含其他内容,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于只清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0022]需要说明的是,在本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个该特征。另外,各个实施例之间
的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。
[0023]请结合参看图1,其为本专利技术实施例提供的分类模型的训练方法的流程图。训练方法用于训练分类模型,训练得到的分类模型能够对无标签数据进行分类。分类模型的训练方法具体包括如下步骤。
[0024]步骤S102,根据第一数据集训练初始分类模型以得到中间分类模型。其中,第一数据集为有标签数据的集合。在本实施例中,训练初始分类模型之前,预先设定若干预设类别。第一数据集中的第一数据包括真实标签,每一第一数据的真实标签与若干预设类别中的一个类别相对应。以预设学习率根据第一数据集对初始分类模型进行训练,并判断初始分类模型的训练次数是否达到预设次数。当初始分类模型的训练次数达到预设次数时,将训练达到预设次数的初始分类模型作为中间分类模型。训练初始分类模型的具体过程为:将第一数据集中的第一数据输入初始分类模型以得到相应的第一标签,根据第一标签和真实标签以预设学习率更新初始分类模型的参数。将第一数据输入更新参数后的初始分类模型以得到新的第一标签,根据新的第一标签和真实标签以预设学习率再次更新初始分类模型的参数,直至训练达到预设次数。将最后一次更新参数后的初始分类模型作为中间分类模型。其中,中间分类模型还没有达到收敛。预设学习率和预设次数可以根据实际情况进行设置,在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类模型的训练方法,其特征在于,所述分类模型的训练方法包括:根据第一数据集训练初始分类模型以得到中间分类模型,其中,所述第一数据集为有标签数据的集合;利用所述中间分类模型提取训练数据集的特征向量,其中,所述训练数据集包括所述第一数据集和第二数据集,所述第二数据集为无标签数据的集合;根据所述训练数据集的特征向量构建最近数据图和最远数据图,其中,所述最近数据图为在所述训练数据集中的每一数据与所述每一数据距离最近的多个其它数据的关系图,所述最远数据图为在所述训练数据集中的每一数据与所述每一数据距离最远的多个其它数据的关系图;根据所述最近数据图和所述最远数据图获取所述第二数据集的预测标签;以及根据所述第一数据集和带有所述预测标签的第二数据集训练所述中间分类模型以得到目标分类模型。2.如权利要求1所述的分类模型的训练方法,其特征在于,根据所述最近数据图和所述最远数据图获取所述第二数据集的预测标签具体包括:根据所述最近数据图构建近邻相似度矩阵,其中,所述近邻相似度矩阵中的数值包括所述训练数据集中每一数据与所述每一数据距离最近的多个其它数据的相似度、所述每一数据与所述训练数据集中除距离最近的多个其它数据以外的剩余数据的相似度、所述训练数据集中同一数据的相似度;根据所述最远数据图构建疏远相似度矩阵,其中,所述疏远相似度矩阵中的数值包括所述训练数据集中每一数据与所述每一数据距离最远的多个其它数据的相似度、所述每一数据与所述训练数据集中除距离最远的多个其它数据以外的剩余数据的相似度、所述训练数据集中同一数据的相似度;以及根据所述训练数据集的初始标签矩阵、所述近邻相似度矩阵以及所述疏远相似度矩阵获取所述第二数据集的预测标签。3.如权利要求2所述的分类模型的训练方法,其特征在于,根据所述训练数据集的初始标签矩阵、所述近邻相似度矩阵以及所述疏远相似度矩阵获取所述第二数据集的预测标签具体包括:根据所述初始标签矩阵和所述近邻相似度矩阵计算得到近邻标签矩阵;根据所述初始标签矩阵和所述疏远相似度矩阵计算得到疏远标签矩阵;根据所述近邻标签矩阵和所述疏远标签矩阵计算得到目标标签矩阵;以及根据所述目标标签矩阵获取所述第二数据集中每一第二数据的预测标签。4. 如权利要求3所述的分类模型的训练方法,其特征在于,根据所述目标标签矩阵获取所述第二数据集中每一第二数据的预测标签具体包括:选取所述目标标签矩阵中与所述第二数据相对应的列中的最大数值为可信数值,其中,所述目标标签矩阵中每一列中的每一数值表示所...

【专利技术属性】
技术研发人员:刘国清杨广王启程郑伟贺硕杨国武
申请(专利权)人:深圳佑驾创新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1