【技术实现步骤摘要】
一种基于双重对比学习的机器学习识别方法
本专利技术涉及多媒体数据处理技术和机器学习
,尤其涉及一种基于双重对比学习的机器学习识别方法。
技术介绍
多媒体(Multimedia)是多种媒体的综合,在计算机系统中,多媒体指组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体,使用的媒体包括文字、图片、照片、声音、动画和影片,以及程式所提供的互动功能等。随着大数据时代的到来,海量多媒体数据的分类和挖掘技术显得尤为重要。在海量数据挖掘中,如何利用从已有数据中分类和挖掘出来的信息来指导新数据的分类和挖掘已成为一个新的研究热点。特别是当某些任务的样本数量较少时,利用多任务学习能够有效的减少海量数据分类和挖掘的时间成本并提高信息获取准确度。例如,面对基于人脸识别的小区门禁系统开发任务,若将每个业主的人脸图像分别划分为一个独立的图像数据类别,就需要系统处理实现对人脸图像的分类识别,判断当前门禁处采集到的人脸图像是属于哪一位业主的人脸(即判断属于哪一个图像数据类别),进而判断是否解除门禁。基于深度学习方法在实践中被证明是一种有效、鲁棒的信息分类方法。深度神经网路(例如深度 ...
【技术保护点】
1.一种基于双重对比学习的机器学习识别方法,其特征在于,在多个不同已知类别的多媒体数据之中选取目标识别样本和对比样本,作为一个机器学习模型f1的输入,对机器学习模型f1进行学习训练,进而利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别;所述机器学习模型f1包括第一子学习模型fDP和第二子学习模型fDE,所述第一子学习模型fDP为卷积神经网络模型或全连接神经网络模型,所述第二子学习模型fDE为卷积神经网络模型或全连接神经网络模型;所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,并根据对比样本输入排列顺序 ...
【技术特征摘要】
1.一种基于双重对比学习的机器学习识别方法,其特征在于,在多个不同已知类别的多媒体数据之中选取目标识别样本和对比样本,作为一个机器学习模型f1的输入,对机器学习模型f1进行学习训练,进而利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别;所述机器学习模型f1包括第一子学习模型fDP和第二子学习模型fDE,所述第一子学习模型fDP为卷积神经网络模型或全连接神经网络模型,所述第二子学习模型fDE为卷积神经网络模型或全连接神经网络模型;所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,并根据对比样本输入排列顺序,将目标识别样本与对比样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,分别将各个多媒体数据样本组合作为所述第二子学习模型fDE的输入,并将各相应的第二子学习模型fDE的输出按照所述对比样本输入排列顺序规则排序构成一个数据向量,作为所述第一子学习模型fDP的输入向量,且所述第一子学习模型fDP的输出向量作为所述机器学习模型的结果向量;由此通过训练学习,使得学习训练所得的机器学习模型f1输出的结果向量中的每一个结果向量元素用以表征目标识别样本与相应排列顺序位置上的一个对比样本所属类别之间的相关性,从而能够利用已知类别的多媒体数据样本采用不同的对比样本输入排列顺序对所述机器学习模型f1进行多次的学习训练。2.根据权利要求1所述基于双重对比学习的机器学习识别方法,其特征在于,作为机器学习模型f1输入的目标识别样本为一个或多个,且均属于同一类别;若作为机器学习模型f1输入的目标识别样本为一个,在将目标识别样本与对比样本以预设定的组合规则进行组合时,所述预设定的组合规则为如下方式之中的一种:组合规则方式①:将所述目标识别样本分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式②:先将各个对比样本进行按类别划分,然后将所述目标识别样本分别与每一个类别的对比样本之间建立组合关系,分别进行组合;若作为机器学习模型f1输入的目标识别样本为多个,在将目标识别样本与对比样本以预设定的组合规则进行组合时,所述预设定的组合规则为如下方式之中的一种:组合规则方式a:将每一个目标识别样本分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式b:先将各个对比样本进行按类别划分,然后将每一个目标识别样本分别与每一个类别的对比样本之间建立组合关系,分别进行组合;组合规则方式c:将全部目标识别样本作为整体分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式d:先将各个对比样本进行按类别划分,然后将全部目标识别样本作为整体分别与每一个类别的对比样本之间建立组合关系,分别进行组合。3.根据权利要求1所述基于双重对比学习的机器学习识别方法,其特征在于,在对机器学习模型f1进行学习训练的过程中,所述目标识别样本和对比样本从预设的多媒体数据样本库中进行选取,每次选取所述多媒体数据样本库中所包含的一部分已知类别的多媒体数据作为目标识别样本和对比样本对机器学习模型f1进行学习训练,并分多次从所述多媒体数据样本库中选取目标识别样本和对比样本对机器学习模型f1进行学习训练,以保证目标识别样本和对比样本的选取遍历所述多媒体数据样本库中所包含的各个多媒体数据类别,且针对多媒体数据样本库中的每个多媒体数据类别均执行了至少H次的对比样本选取操作,H为与设定的训练选取次数阈值。4.根据权利要求1所述基于双重对比学习的机器学习识别方法,其特征在于,所述利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别的具体方式为:获取作为待识别对象的多媒体数据作为待识别样本,以及从多个不同已知类别的多媒体数据之中选取的对比样本,作为学习训练后的机器学习模型f1的输入,所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,并根据对比样本输入排列顺序,将待识别样本与对比样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,分别将各个多媒体数据样本组合作为所述第二子学习模型fDE的输入,并将各相应的第二子学习模型fDE的输出按照所述对比样本输入排列顺序规则排序构成一个数据向量,作为所述第一子学习模型fDP的...
【专利技术属性】
技术研发人员:徐传运,许洲,张杨,
申请(专利权)人:重庆理工大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。