The invention provides a machine learning recognition method based on embedded coding learning, which can make use of a certain number of multimedia data samples of known categories to classify the machine learning model F1 by different contrast samples in order to carry out multiple learning and training for the classification of multimedia data category recognition and processing. The learning model F1 is designed as the combination model framework of the coding function model and the convolution neural network model or the fully connected neural network model, which greatly reduces the dependence on the mass training samples, and can easily extend the class recognition of the non learning and training multimedia data categories, which is a good solution to the existing multimedia. The data classification machine learning recognition method is more widely and effectively applied to more specific applications of multimedia data classification because of its dependence on a large number of training samples and the inability to classify the categories of unlearned training directly.
【技术实现步骤摘要】
一种基于嵌入编码学习的机器学习识别方法
本专利技术涉及多媒体数据处理技术和机器学习
,尤其涉及一种基于嵌入编码学习的机器学习识别方法。
技术介绍
多媒体(Multimedia)是多种媒体的综合,在计算机系统中,多媒体指组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体,使用的媒体包括文字、图片、照片、声音、动画和影片,以及程式所提供的互动功能等。随着大数据时代的到来,海量多媒体数据的分类和挖掘技术显得尤为重要。在海量数据挖掘中,如何利用从已有数据中分类和挖掘出来的信息来指导新数据的分类和挖掘已成为一个新的研究热点。特别是当某些任务的样本数量较少时,利用多任务学习能够有效的减少海量数据分类和挖掘的时间成本并提高信息获取准确度。例如,面对基于人脸识别的小区门禁系统开发任务,若将每个业主的人脸图像分别划分为一个独立的图像数据类别,就需要系统处理实现对人脸图像的分类识别,判断当前门禁处采集到的人脸图像是属于哪一位业主的人脸(即判断属于哪一个图像数据类别),进而判断是否解除门禁。基于深度学习方法在实践中被证明是一种有效、鲁棒的信息分类方法。深度神经网路(例如深度卷积神经网络)是最具代表性的机器学习方法。深度学习模型通常有数十层可学习的数据处理层,有数十万、甚至数百万的可以学习参数。由于大量参数构成极其巨大的学习空间,为了得到最优的模型参数,通常需要大量的训练数据。但是,为了训练深度学习模型,必须构建拥有大量样本的训练数据集,通常训练样本数量在数万以上。然而,构建这样的训练集,在实际应用中是非常困难的,并且代价昂贵。例如,面对基于人脸识别的小区门禁系统开发 ...
【技术保护点】
1.一种基于嵌入编码学习的机器学习识别方法,其特征在于,在多个不同已知类别的多媒体数据之中选取目标识别样本和对比样本,作为一个机器学习模型f1的输入,对机器学习模型f1进行学习训练,进而利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别;所述机器学习模型f1包括第一子学习模型fDP和第二子函数模型fE,所述第一子学习模型fDP为卷积神经网络模型或全连接神经网络模型,所述第二子函数模型fE为数据特征提取编码函数模型或数据降维编码函数模型;所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,将目标识别样本和对比样本分别作为所述第二子函数模型fE的输入,由所述第二子函数模型fE分别输出相对应的目标识别数据样本和对比数据样本,并根据对比样本输入排列顺序,将目标识别数据样本与对比数据样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,再将各数据样本组合按照所述对比样本输入排列顺序规则排序构成一个数据向量,作为所述第一子学习模型fDP的输入向量,且所述第一子学习模型fDP的输出向量作为所述机器 ...
【技术特征摘要】
1.一种基于嵌入编码学习的机器学习识别方法,其特征在于,在多个不同已知类别的多媒体数据之中选取目标识别样本和对比样本,作为一个机器学习模型f1的输入,对机器学习模型f1进行学习训练,进而利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别;所述机器学习模型f1包括第一子学习模型fDP和第二子函数模型fE,所述第一子学习模型fDP为卷积神经网络模型或全连接神经网络模型,所述第二子函数模型fE为数据特征提取编码函数模型或数据降维编码函数模型;所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,将目标识别样本和对比样本分别作为所述第二子函数模型fE的输入,由所述第二子函数模型fE分别输出相对应的目标识别数据样本和对比数据样本,并根据对比样本输入排列顺序,将目标识别数据样本与对比数据样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,再将各数据样本组合按照所述对比样本输入排列顺序规则排序构成一个数据向量,作为所述第一子学习模型fDP的输入向量,且所述第一子学习模型fDP的输出向量作为所述机器学习模型的结果向量;由此通过训练学习,使得学习训练所得的机器学习模型f1输出的结果向量中的每一个结果向量元素用以表征目标识别样本与相应排列顺序位置上的一个对比样本所属类别之间的相关性,从而能够利用已知类别的多媒体数据样本采用不同的对比样本输入排列顺序对所述机器学习模型f1进行多次的学习训练。2.根据权利要求1所述基于嵌入编码学习的机器学习识别方法,其特征在于,将目标识别样本和对比样本分别输入至第二子函数模型fE得到相对应的目标识别数据样本和对比数据样本的具体方式为如下处理方式之中的一种:处理方式①:将每个目标识别样本和每个对比样本分别输入至第二子函数模型fE,得到每个目标识别样本相对应的目标识别数据样本,以及每个对比样本相对应的对比数据样本;处理方式②:先将各个对比样本进行按类别划分,将目标识别样本作为整体输入至第二子函数模型fE,将每个类别的对比样本分别输入至第二子函数模型fE,从而得到目标识别样本整体相对应的目标识别数据样本,以及每个类别的对比样本相对应的对比数据样本。3.根据权利要求1所述基于嵌入编码学习的机器学习识别方法,其特征在于,作为机器学习模型f1输入的目标识别样本为一个或多个,且均属于同一类别;若作为机器学习模型f1输入的目标识别样本为一个,在将目标识别数据样本与对比数据样本以预设定的组合规则进行组合时,所述预设定的组合规则为如下方式之中的一种:组合规则方式①:将所述目标识别样本分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式②:先将各个对比样本进行按类别划分,然后将所述目标识别样本分别与每一个类别的对比样本之间建立组合关系,分别进行组合;若作为机器学习模型f1输入的目标识别样本为多个,在将目标识别数据样本与对比数据样本以预设定的组合规则进行组合时,所述预设定的组合规则为如下方式之中的一种:组合规则方式a:将每一个目标识别样本分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式b:先将各个对比样本进行按类别划分,然后将每一个目标识别样本分别与每一个类别的对比样本之间建立组合关系,分别进行组合;组合规则方式c:将全部目标识别样本作为整体分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式d:先将各个对比样本进行按类别划分,然后将全部目标识别样本作为整体分别与每一个类别的对比样本之间建立组合关系,分别进行组合。4.根据权利要求1所述基于嵌入编码学习的机器学习识别方法,其特征在于,在对机器学习模型f1进行学习训练的过程中,所述目标识别样本和对比样本从预设的多媒体数据样本库中进行选取,每次选取所述多媒体数据样本库中所包含的一部分已知类别的多媒体数据作为目标识别样本和对比样本对机器学习模型f1进行学习训练,并分多次从所述多媒体数据样本库中选取目标识别样本和对比样本对机器学习模型f1进行学习训练,以保证目标识别样本和对比样本的选取遍历所述多媒体数据样本库中所包含的各个多媒体数据类别,且针对多媒体数据样本库中的每个多媒体数据类别均执行了至少H次的对比样本选取操作,H为与设定的训练选取次数阈值。5.根据权利要求1所述基于嵌入编码学习的机器学习识别方法,其特征在于,所述利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别的具体方式为:获取作为待识别对象的多媒体数据作为待识别样本,以及从多个不同已知类别的多媒体数据之中选取的对比样本,作为学习训练后的机器学习模型f1的输入,所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,将待识别样本和对比样本分别作为所述第二子函数模型fE的输入,由所述第二子函数模型fE分别输出相对应的待识别数据样本和对比数据样本,并根据对比样本输入排列顺序,将待识别数据样本与对比数据样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,再将各数据样本组合按照所述对比样本输...
【专利技术属性】
技术研发人员:李刚,徐传运,许洲,张杨,
申请(专利权)人:重庆理工大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。