The invention discloses a method for establishing a database of hyperspectral based on deep learning semi automation, which comprises the following steps: using four different principle of spectral information acquisition device based on natural scene, a spectral database annotation is not; quality inspection after selects a part of data in the manual annotation Crowdsourcing platform; principle deep learning based on the labeling process as a part of two classification problems, using spectral data of known mark the true value of the training set and select a best classifier, and then use the other part of the data set for validation, unlabeled data can be marked automatically by the classifier, only need manual inspection can be. The method greatly saves human resources and the cost of marking, and reduces the time needed to build a large annotated dense spectral database, which can conveniently provide a dense spectral database with known annotated information for the spectral domain.
【技术实现步骤摘要】
一种基于深度学习的高光谱数据库半自动化建立方法
本专利技术涉及计算光谱成像领域,尤其涉及一种基于深度学习的大型光谱数据库半自动化建立方法。
技术介绍
自然场景下物体所具有的边缘、形状、颜色等特征常被用来进行图像分割、白平衡、材质检测、目标识别、检测和跟踪等科学研究,但往往受背景杂乱、非刚性形变、模糊、光照、遮挡等的因素影响很大。现有的监督学习算法表现出了优越的性能,这些学习模型大都需要大量参数,例如深度卷积网络,随着层数的增加,算法模型需要大量带有人工注释的数据来支撑,优良数据库的缺失是阻挡目前深度卷积网络提升性能的主要限制因素。光谱反映物质的光学辐射,揭示物质的本质属性,具有丰富的细节特征。在光谱维度上,现有的图像仅利用了红绿蓝(RGB)三个通道的信息,丢失了光谱维度上的大量细节特征。光谱信息和空间信息的融合在图像去噪、图像分割、目标追踪、白平衡、场景理解等领域已取得重大突破。但是自然场景下的光谱数据库数量少、数据集稀疏、年代已久,已经不能满足现有研究的需求,如何建立一个大规模的自然场景光谱数据库是计算光谱成像领域一个急需解决的难题。带有标注的大规模数据库的采集 ...
【技术保护点】
一种基于深度学习的高光谱数据库半自动化建立方法,其特征在于,包括如下步骤:步骤1,通过控制变量的方法同时利用四种基于不同原理的高光谱成像仪采集不同光照条件下的自然场景的光谱数据和与之对齐的RGB彩色图,建立小型光谱数据库;步骤2,对光谱数据库进行标准化处理后放进数据池中,然后从数据池中随机抽取一部分数据进行质量检验,采用光谱角度匹配法将采集得到的光源光谱与标准光源光谱进行比对,若相似度达到99%,判断采集得到的光谱数据无误,则保留,否则剔除;步骤3,在步骤2筛选后的数据池中随机抽取一部分数据进行人工标注得到真值,标注文件与图片名一一对应;步骤4,将已标注的数据随机分成测试集 ...
【技术特征摘要】
1.一种基于深度学习的高光谱数据库半自动化建立方法,其特征在于,包括如下步骤:步骤1,通过控制变量的方法同时利用四种基于不同原理的高光谱成像仪采集不同光照条件下的自然场景的光谱数据和与之对齐的RGB彩色图,建立小型光谱数据库;步骤2,对光谱数据库进行标准化处理后放进数据池中,然后从数据池中随机抽取一部分数据进行质量检验,采用光谱角度匹配法将采集得到的光源光谱与标准光源光谱进行比对,若相似度达到99%,判断采集得到的光谱数据无误,则保留,否则剔除;步骤3,在步骤2筛选后的数据池中随机抽取一部分数据进行人工标注得到真值,标注文件与图片名一一对应;步骤4,将已标注的数据随机分成测试集和训练集,利用深度学习的方法对训练集进行训练得到二值分类器,然后利用测试集对二值分类器进行检验,为分类器输出的置信度设置两个阈值Threshold1与阈值Threshold2,且阈值Threshold1>阈值Threshold2;若分类器输出分值大于阈值Threshold1,则认为分类正确;若分类器输出分值小于阈值Threshold2,则认为分类错误;若分类器输出分值位于两个阈值之间,则认为分类模糊,将对应的图片投入下一个迭代...
【专利技术属性】
技术研发人员:岳涛,赵远远,陈林森,陈都,董辰辰,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。