一种数据知识双驱动的硅藻图像分类系统和方法技术方案

技术编号:39258528 阅读:32 留言:0更新日期:2023-10-30 12:10
本发明专利技术公开了一种数据知识双驱动的硅藻图像分类系统和方法,该系统包括生成对抗网络模块、知识学习模块和深度残差网络模块;生成对抗网络模块设计一个适合硅藻图像生成的生成对抗网络模型以扩充硅藻图像数据集。知识学习模块将硅藻知识嵌入到知识向量空间。深度残差网络模块则将硅藻图像嵌入到特征向量空间。为克服知识域和特征域语义鸿沟,利用知识辅助深度残差网络分类,本发明专利技术采用多层感知机将知识域嵌入投影到特征域,并采用最小均方误差损失函数最小化特征域内知识嵌入和特征嵌入的距离。相较于传统未加生成对抗网络和知识属性的分类模型,本发明专利技术方法在准确率(Precision)提升了8.6%、召回率(Recall)提升了9.7%、损失降低了31.6%。失降低了31.6%。失降低了31.6%。

【技术实现步骤摘要】
Intelligence,2002,24(7):971

987.)采用曲率和轮廓等进行硅藻形态特征提取,并利用最临近分类器和决策树进行分类识别。欧共体DiCANN项目人员利用人工神经网络技术对4个甲藻类属的多个藻类进行检测。通过离散傅里叶变换,SOBEL算子以及Gabor小波变换进行特征提取,并利用神经网络分类学习,最终获得84.9%识别精度。
[0005]国内专家学者也致力于藻类图像识别,上海交通大学汪振兴教授等人的论文“赤潮藻类图像自动识别的研究”(海洋环境科学,2007,26(1):42

44.)采用形态和纹理特征,并结合遗传算法对藻类图像进行特征提取,然后利用人工神经网络技术进行分类识别。该算法能够对主要的赤潮藻类进行有效分类,其分类精度接近人工分类效果。中国海洋大学姬婷婷等人的论文“基于自适应幅度谱分析的显著目标检测”(中国海洋大学学报:自然科学版,2017,47(7).)通过提取藻类图像的圆度,扁度,不变矩,矩形度等形态特征,再利用最邻近准则对17种主要藻类植物进行分类,最终准确率达到90%。另外,于连生等人的论文“Parti本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据知识双驱动的硅藻图像分类系统,其特征在于,所述系统包括生成对抗网络模块、知识学习模块和深度残差网络模块:生成对抗网络模块,是通过使用真实硅藻图像数据训练生成器,并利用判别器将真实硅藻图像和生成器生成图像进行区分,通过交替训练生成器和判别器,使得生成器生成图像逐渐接近于真实硅藻图像,所述生成对抗网络模块关键在于通过训练好的生成器生成一定数量的硅藻图像样本,以供后续深度残差网络训练使用;知识学习模块是将硅藻知识嵌入到低维连续向量空间以便集成到深度学习模型,,利用预训练BERT模型作为硅藻知识编码器,所述编码器将硅藻特征的文字描述作为输入,输出768维向量,利用多层感知机将知识域嵌入投影到特征域,作为最终知识嵌入;深度残差网络模块是构建深度残差网络模型获取图像特征嵌入并使其与知识嵌入对齐,,采用预训练深度残差网络获取图像特征嵌入,再利用最小均方误差损失使得该特征嵌入与其对应类别的知识嵌入对齐,,然后利用训练好的网络实现硅藻分类。2.一种数据知识双驱动的硅藻图像分类系统的实现方法,其特征在于,所述方法包括如下步骤:步骤1:通过电镜扫描仪,获取硅藻图像数据,;步骤2:构建生成对抗网络模型,并训练生成对抗网络,;步骤3:根据硅藻知识图谱构建并预训练知识学习模型;步骤4:结合知识学习模型和深度残差网络模型构建数据知识双驱动的硅藻图像分类模型;步骤5:进行模型训练并对模型效果进行评估。3.根据权利要求2所述的一种数据知识双驱动的硅藻图像分类系统的实现方法,其特征在于,所述步骤1包括:准备硅藻样本,电镜扫描仪观察,使用硅藻图像采集设备将显微镜下的图像转换为数字图像,对获取的硅藻图像进行必要的图像处理,将获取的硅藻图像数据保存在合适的数据存储设备或数据库中,并进行适当的标注和分类。4.根据权利要求2所述的一种数据知识双驱动的硅藻图像分类系统的实现方法,其特征在于,所述步骤2包括:设计一个硅藻图像生成任务的生成对抗模型,生成对抗网络是由生成器和判别器组成的一种深度学习模型,生成器的任务是从随机噪声中生成逼真的硅藻样本,而判别器则负责判断给定样本是真实硅藻样本还是生成器产生的硅藻样本,训练过程中,生成器不断生成硅藻样本,而判别器则根据生成器生成的硅藻样本进行分类;生成器的目标是尽可能欺骗判别器,使其将生成器产生的硅藻样本误认为是真实样本;生成器的损失函数定义为生成硅藻样本与真实硅藻样本的差异:LOSS_G=

log(D(G(z)))其中,G(z)表示生成器生成的硅藻样本,D表示判别器,z表示随机噪声;判别器的目标是尽可能准确地区分真实硅藻样本和生成器产生的硅藻样本,判别器的损失函数使用交叉熵来度量该二分类任务的准确性:LOSS_D=

log(D(x))

log(1

D(G(z)))其中,x为真实硅藻样本,在训练过程中,生成器和判别器通过交替优化来提升性能,首先,固定生成器,训练判别器以最大化正确分...

【专利技术属性】
技术研发人员:丛璐璐吴伟刘纯玉李沁欣
申请(专利权)人:中国科学院南京地理与湖泊研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1