【技术实现步骤摘要】
特征校正的小样本学习标注方法、装置及分类识别方法
[0001]本专利技术涉及小样本学习
,具体涉及特征校正的小样本学习标注方法、装置及分类识别方法。
技术介绍
[0002]近年来,得益于计算机算力的飞速提升,深度学习成为了人工智能领域研究的热门,在多个领域得到了广泛的应用。然而现有深度学习模型严重依赖大规模集中式人工标注训练数据,并且越复杂的网络就越需要更加庞大的数据集来训练。同时一些特殊的行业领域数据是非常匮乏的,例如医学图像病例的判别,由此导致了数据采集与人工标注的成本不断上升。这时就希望模型可以尽可能减少对数据的依赖,像人类一样可以进行快速的学习。人类非常擅长通过极少量的样本识别一个新物体,比如小孩子只需要书中的一些图片就可以认识什么是“大象”,什么是“鸵鸟”。在人的快速学习能力启发下,小样本学习渐渐得到了许多研究者的关注,希望模型具有从少量数据中快速泛化的能力,从而大大减少数据的人工标注成本。
[0003]小样本学习的目的为降低人工智能应用的数据使用成本,小样本模型的训练不依赖大规模数据集,而是在少量已 ...
【技术保护点】
【技术特征摘要】
1.特征校正的小样本学习标注装置,其特征在于,包括通过对D
base
训练的小样本学习模型,使得该模型对D
novel
的支撑集S提取到的特征与对应标签的映射关系,可以预测D
novel
中查询集Q的对应标签;其中D
base
:大量有标签样本集共有W类;D
novel
:少量由标签样本(支撑集S)和无标签样本集(查询集Q),共有K类别,2.一种特征校正的小样本学习标注装置的标注方法,其特征在于,包括以下步骤:专家投票选出一批7类标准舌色数据作为D
novel
,以标准舌色数据进行小样本学习,对训练集D
base
得到的基本分类器Res10对舌色数据进行特征提取,使用PT变换对提取的特征进行拟合;计算标准舌色数据的方差及均值对提取到的舌色特征进行归一化校正,使用FCN
‑
EMD实现对舌色无标签数据的度量标准,多次随机抽取标准舌色数据对样本进行标注,最后使用投票作为标注结果,从而实现对舌色数据的标注;deepEMD方法假设提取到的特征和训练集提取的特征都默认符合数据分布,数据归一化采用的是特征的均值。3.根据权利要求2所述的一种特征校正的小样本学习标注装置的标注方法,所述标注流程包括模型训练阶段:使用大规模数据集ImageNet预训练小样本学习Res10基本分类器,进行特征提取获取小样本学习基本特征提取器;对训练集合的特征使用Power transform(PT)进行特征转换,使得大规模数据集的同类数据的特征符合高斯分布,PT具体计算如下:其中x∈D
tonguecolor
,ε=1e
‑
6,为Res10提取的特征向量;(1)幂变换具有减少分布偏斜的功能,由β调整,(2)单位方差投影将特征缩放到相同的区域,以便大方差特征不会主导其他特征;大规模数据集的每类特征进行PT变换后,计算每一类特征的均值x
...
【专利技术属性】
技术研发人员:胡素黎,李力,刘则军,鲍新平,
申请(专利权)人:来康生命科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。