一种基于嵌入编码学习的机器学习识别方法技术

技术编号:18576614 阅读:28 留言:0更新日期:2018-08-01 11:42
本发明专利技术提供了一种基于嵌入编码学习的机器学习识别方法,能够利用已知类别的一定量的多媒体数据样本采用不同的对比样本输入排列顺序对机器学习模型f1进行多次区别化的学习训练,用以进行多媒体数据类别识别处理,机器学习模型f1设计为编码函数模型与卷积神经网络模型或全连接神经网络模型的组合模型构架,大幅降低了对海量训练样本的依赖,并且能够方便的扩展对未经过学习训练的多媒体数据类别进行类别识别,很好的解决了现有多媒体数据分类机器学习识别方法因对大量训练样本的依赖以及因无法直接对未经学习训练的类别进行分类识别而导致实际应用性、通用性受限的问题,能够更加广泛有效的应用到更多的具体的多媒体数据分类使用场合中。

A machine learning recognition method based on embedded coding learning

The invention provides a machine learning recognition method based on embedded coding learning, which can make use of a certain number of multimedia data samples of known categories to classify the machine learning model F1 by different contrast samples in order to carry out multiple learning and training for the classification of multimedia data category recognition and processing. The learning model F1 is designed as the combination model framework of the coding function model and the convolution neural network model or the fully connected neural network model, which greatly reduces the dependence on the mass training samples, and can easily extend the class recognition of the non learning and training multimedia data categories, which is a good solution to the existing multimedia. The data classification machine learning recognition method is more widely and effectively applied to more specific applications of multimedia data classification because of its dependence on a large number of training samples and the inability to classify the categories of unlearned training directly.

【技术实现步骤摘要】
一种基于嵌入编码学习的机器学习识别方法
本专利技术涉及多媒体数据处理技术和机器学习
,尤其涉及一种基于嵌入编码学习的机器学习识别方法。
技术介绍
多媒体(Multimedia)是多种媒体的综合,在计算机系统中,多媒体指组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体,使用的媒体包括文字、图片、照片、声音、动画和影片,以及程式所提供的互动功能等。随着大数据时代的到来,海量多媒体数据的分类和挖掘技术显得尤为重要。在海量数据挖掘中,如何利用从已有数据中分类和挖掘出来的信息来指导新数据的分类和挖掘已成为一个新的研究热点。特别是当某些任务的样本数量较少时,利用多任务学习能够有效的减少海量数据分类和挖掘的时间成本并提高信息获取准确度。例如,面对基于人脸识别的小区门禁系统开发任务,若将每个业主的人脸图像分别划分为一个独立的图像数据类别,就需要系统处理实现对人脸图像的分类识别,判断当前门禁处采集到的人脸图像是属于哪一位业主的人脸(即判断属于哪一个图像数据类别),进而判断是否解除门禁。基于深度学习方法在实践中被证明是一种有效、鲁棒的信息分类方法。深度神经网路(例如深度卷积神经网络)是最具代表性的机器学习方法。深度学习模型通常有数十层可学习的数据处理层,有数十万、甚至数百万的可以学习参数。由于大量参数构成极其巨大的学习空间,为了得到最优的模型参数,通常需要大量的训练数据。但是,为了训练深度学习模型,必须构建拥有大量样本的训练数据集,通常训练样本数量在数万以上。然而,构建这样的训练集,在实际应用中是非常困难的,并且代价昂贵。例如,面对基于人脸识别的小区门禁系统开发任务,若将每个业主的人脸图像分别划分为一个独立的图像数据类别,在对机器学习模型进行分类识别训练时,如果需要对于每一个业主采集数以万计的人脸图像训练样本,是非常不现实的。这导致了深度模型对大数据的贪婪导致深度学习方法在很多领域都难以得到具体应用,或者说很难具有可靠的技术可实现性。在深度学习方法用于分类任务时,传统的深度学习方法要求分类模型对比样本的类必须与生产样本的类相同,即模型只能分类已学习的类,如果有新的类的样本需要分类,必须重新训练机器学习模型,或者对机器学习模型做一些适应性的训练学习。例如,面对基于人脸识别的小区门禁系统开发任务,若将每个业主的人脸图像分别划分为一个独立的图像数据类别,采用目前的深度学习方法,都需要对当前每一位业主的人脸图像进行学习训练;当有一位新的业主出现时,即便将该新业主的人脸图像直接加入到识别对比样本数据库中,由于机器学习模型之前并未对该新业主的人脸图像进行学习训练,因此当门禁处再次采集到该新业主的人脸图像时,机器学习模型依然无法基于对比样本数据库中该新业主的人脸图像数据而直接分类识别出该新业主。这也导致了基于深度学习方法的机器学习模型的训练,需要消耗大量的训练计算资源和较长的训练学习时间,限制了其在实际应用场合中的使用便利性和通用性。
技术实现思路
针对现有技术中存在的上述不足,本专利技术解决的技术问题在于如何提供一种基于嵌入编码学习的机器学习识别方法,用以解决现有的多媒体数据分类机器学习识别方法需要依赖大量的训练样本而导致实际应用受限的问题,进一步解决现有的多媒体数据分类机器学习识别方法无法直接对未经学习训练的类别进行分类识别而导致通用性受限的问题。为解决上述技术问题,本专利技术采用了如下的技术手段:基于嵌入编码学习的机器学习识别方法,在多个不同已知类别的多媒体数据之中选取目标识别样本和对比样本,作为一个机器学习模型f1的输入,对机器学习模型f1进行学习训练,进而利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别;所述机器学习模型f1包括第一子学习模型fDP和第二子函数模型fE,所述第一子学习模型fDP为卷积神经网络模型或全连接神经网络模型,所述第二子函数模型fE为数据特征提取编码函数模型或数据降维编码函数模型;所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,将目标识别样本和对比样本分别作为所述第二子函数模型fE的输入,由所述第二子函数模型fE分别输出相对应的目标识别数据样本和对比数据样本,并根据对比样本输入排列顺序,将目标识别数据样本与对比数据样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,再将各数据样本组合按照所述对比样本输入排列顺序规则排序构成一个数据向量,作为所述第一子学习模型fDP的输入向量,且所述第一子学习模型fDP的输出向量作为所述机器学习模型的结果向量;由此通过训练学习,使得学习训练所得的机器学习模型f1输出的结果向量中的每一个结果向量元素用以表征目标识别样本与相应排列顺序位置上的一个对比样本所属类别之间的相关性,从而能够利用已知类别的多媒体数据样本采用不同的对比样本输入排列顺序对所述机器学习模型f1进行多次的学习训练。上述基于嵌入编码学习的机器学习识别方法中,作为优选方案,将目标识别样本和对比样本分别输入至第二子函数模型fE得到相对应的目标识别数据样本和对比数据样本的具体方式为如下处理方式之中的一种:处理方式①:将每个目标识别样本和每个对比样本分别输入至第二子函数模型fE,得到每个目标识别样本相对应的目标识别数据样本,以及每个对比样本相对应的对比数据样本;处理方式②:先将各个对比样本进行按类别划分,将目标识别样本作为整体输入至第二子函数模型fE,将每个类别的对比样本分别输入至第二子函数模型fE,从而得到目标识别样本整体相对应的目标识别数据样本,以及每个类别的对比样本相对应的对比数据样本。上述基于嵌入编码学习的机器学习识别方法中,作为优选方案,作为机器学习模型f1输入的目标识别样本为一个或多个,且均属于同一类别;若作为机器学习模型f1输入的目标识别样本为一个,在将目标识别数据样本与对比数据样本以预设定的组合规则进行组合时,所述预设定的组合规则为如下方式之中的一种:组合规则方式①:将所述目标识别样本分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式②:先将各个对比样本进行按类别划分,然后将所述目标识别样本分别与每一个类别的对比样本之间建立组合关系,分别进行组合;若作为机器学习模型f1输入的目标识别样本为多个,在将目标识别数据样本与对比数据样本以预设定的组合规则进行组合时,所述预设定的组合规则为如下方式之中的一种:组合规则方式a:将每一个目标识别样本分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式b:先将各个对比样本进行按类别划分,然后将每一个目标识别样本分别与每一个类别的对比样本之间建立组合关系,分别进行组合;组合规则方式c:将全部目标识别样本作为整体分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式d:先将各个对比样本进行按类别划分,然后将全部目标识别样本作为整体分别与每一个类别的对比样本之间建立组合关系,分别进行组合。上述基于嵌入编码学习的机器学习识别方法中,作为优选方案,在对机器学习模型f1进行学习训练的过程中,所述目标识别样本和对比样本从预设的多媒体数据样本库中进行选取,每次选取所述多媒体数据样本库中所包含的一部分已知类本文档来自技高网
...

【技术保护点】
1.一种基于嵌入编码学习的机器学习识别方法,其特征在于,在多个不同已知类别的多媒体数据之中选取目标识别样本和对比样本,作为一个机器学习模型f1的输入,对机器学习模型f1进行学习训练,进而利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别;所述机器学习模型f1包括第一子学习模型fDP和第二子函数模型fE,所述第一子学习模型fDP为卷积神经网络模型或全连接神经网络模型,所述第二子函数模型fE为数据特征提取编码函数模型或数据降维编码函数模型;所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,将目标识别样本和对比样本分别作为所述第二子函数模型fE的输入,由所述第二子函数模型fE分别输出相对应的目标识别数据样本和对比数据样本,并根据对比样本输入排列顺序,将目标识别数据样本与对比数据样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,再将各数据样本组合按照所述对比样本输入排列顺序规则排序构成一个数据向量,作为所述第一子学习模型fDP的输入向量,且所述第一子学习模型fDP的输出向量作为所述机器学习模型的结果向量;由此通过训练学习,使得学习训练所得的机器学习模型f1输出的结果向量中的每一个结果向量元素用以表征目标识别样本与相应排列顺序位置上的一个对比样本所属类别之间的相关性,从而能够利用已知类别的多媒体数据样本采用不同的对比样本输入排列顺序对所述机器学习模型f1进行多次的学习训练。...

【技术特征摘要】
1.一种基于嵌入编码学习的机器学习识别方法,其特征在于,在多个不同已知类别的多媒体数据之中选取目标识别样本和对比样本,作为一个机器学习模型f1的输入,对机器学习模型f1进行学习训练,进而利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别;所述机器学习模型f1包括第一子学习模型fDP和第二子函数模型fE,所述第一子学习模型fDP为卷积神经网络模型或全连接神经网络模型,所述第二子函数模型fE为数据特征提取编码函数模型或数据降维编码函数模型;所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,将目标识别样本和对比样本分别作为所述第二子函数模型fE的输入,由所述第二子函数模型fE分别输出相对应的目标识别数据样本和对比数据样本,并根据对比样本输入排列顺序,将目标识别数据样本与对比数据样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,再将各数据样本组合按照所述对比样本输入排列顺序规则排序构成一个数据向量,作为所述第一子学习模型fDP的输入向量,且所述第一子学习模型fDP的输出向量作为所述机器学习模型的结果向量;由此通过训练学习,使得学习训练所得的机器学习模型f1输出的结果向量中的每一个结果向量元素用以表征目标识别样本与相应排列顺序位置上的一个对比样本所属类别之间的相关性,从而能够利用已知类别的多媒体数据样本采用不同的对比样本输入排列顺序对所述机器学习模型f1进行多次的学习训练。2.根据权利要求1所述基于嵌入编码学习的机器学习识别方法,其特征在于,将目标识别样本和对比样本分别输入至第二子函数模型fE得到相对应的目标识别数据样本和对比数据样本的具体方式为如下处理方式之中的一种:处理方式①:将每个目标识别样本和每个对比样本分别输入至第二子函数模型fE,得到每个目标识别样本相对应的目标识别数据样本,以及每个对比样本相对应的对比数据样本;处理方式②:先将各个对比样本进行按类别划分,将目标识别样本作为整体输入至第二子函数模型fE,将每个类别的对比样本分别输入至第二子函数模型fE,从而得到目标识别样本整体相对应的目标识别数据样本,以及每个类别的对比样本相对应的对比数据样本。3.根据权利要求1所述基于嵌入编码学习的机器学习识别方法,其特征在于,作为机器学习模型f1输入的目标识别样本为一个或多个,且均属于同一类别;若作为机器学习模型f1输入的目标识别样本为一个,在将目标识别数据样本与对比数据样本以预设定的组合规则进行组合时,所述预设定的组合规则为如下方式之中的一种:组合规则方式①:将所述目标识别样本分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式②:先将各个对比样本进行按类别划分,然后将所述目标识别样本分别与每一个类别的对比样本之间建立组合关系,分别进行组合;若作为机器学习模型f1输入的目标识别样本为多个,在将目标识别数据样本与对比数据样本以预设定的组合规则进行组合时,所述预设定的组合规则为如下方式之中的一种:组合规则方式a:将每一个目标识别样本分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式b:先将各个对比样本进行按类别划分,然后将每一个目标识别样本分别与每一个类别的对比样本之间建立组合关系,分别进行组合;组合规则方式c:将全部目标识别样本作为整体分别与每一个对比样本之间建立配对组合关系,分别进行配对组合;组合规则方式d:先将各个对比样本进行按类别划分,然后将全部目标识别样本作为整体分别与每一个类别的对比样本之间建立组合关系,分别进行组合。4.根据权利要求1所述基于嵌入编码学习的机器学习识别方法,其特征在于,在对机器学习模型f1进行学习训练的过程中,所述目标识别样本和对比样本从预设的多媒体数据样本库中进行选取,每次选取所述多媒体数据样本库中所包含的一部分已知类别的多媒体数据作为目标识别样本和对比样本对机器学习模型f1进行学习训练,并分多次从所述多媒体数据样本库中选取目标识别样本和对比样本对机器学习模型f1进行学习训练,以保证目标识别样本和对比样本的选取遍历所述多媒体数据样本库中所包含的各个多媒体数据类别,且针对多媒体数据样本库中的每个多媒体数据类别均执行了至少H次的对比样本选取操作,H为与设定的训练选取次数阈值。5.根据权利要求1所述基于嵌入编码学习的机器学习识别方法,其特征在于,所述利用学习训练后的机器学习模型f1对待识别多媒体数据进行类别识别的具体方式为:获取作为待识别对象的多媒体数据作为待识别样本,以及从多个不同已知类别的多媒体数据之中选取的对比样本,作为学习训练后的机器学习模型f1的输入,所选取的对比样本包含两个以上的不同类别的多个多媒体数据,且设置对比样本输入至机器学习模型f1的输入排列顺序,将待识别样本和对比样本分别作为所述第二子函数模型fE的输入,由所述第二子函数模型fE分别输出相对应的待识别数据样本和对比数据样本,并根据对比样本输入排列顺序,将待识别数据样本与对比数据样本以预设定的组合规则进行组合,由此形成保留有对比样本输入排列顺序规则的多个数据样本组合,再将各数据样本组合按照所述对比样本输...

【专利技术属性】
技术研发人员:李刚徐传运许洲张杨
申请(专利权)人:重庆理工大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1