一种基于spark的图像处理方法及系统技术方案

技术编号:37712079 阅读:27 留言:0更新日期:2023-06-02 00:05
本申请实施例涉及图像处理和大数据并行处理技术领域,具体涉及一种基于spark的图像处理方法及系统。该方法首先提取待处理图像的图像特征;其次将所述图像特征进行聚类分析,构建视觉词袋模型,得到视觉词袋特征向量;然后在所述待处理图像中划分不同的尺度空间,构建图像空间金字塔模型;最后将所述视觉词袋特征向量输入至所述图像空间金字塔模型,得到所述待处理图像的图像特征信息,得到了更加准确的图像特征信息,为后续在spark平台上进行图像分类打下了良好的基础。像分类打下了良好的基础。像分类打下了良好的基础。

【技术实现步骤摘要】
一种基于spark的图像处理方法及系统


[0001]本申请涉及图像处理和大数据并行处理
,尤其涉及一种基于spark的图像处理方法及系统。

技术介绍

[0002]Spark大数据分布式计算框架是一种基于内存的计算框架,可以以集群模式对大量数据进行并行处理。当前大数据领域研究中,大部分是将文本数据存储在分布式文件系统HDFS中,然后利用Spark进行处理,由于Spark框架本身并没有封装深度学习的相关模块,导致Spark只擅长处理文本数据。
[0003]随着5G时代的高速发展,手机、平板等智能设备终端完全融入到人们的生活之中,人们更愿意在网络上去分享自己的生活,随之而来的就是图像搜索量和处理量的上升,如何将海量的图像进行分类就变得尤为重要。图像分类技术的重点在于对图像信息进行描述,再利用这些信息结合现在非常流行的机器学习和人工智能的思想对于数据进行训练,最后预测并分类。
[0004]传统的图像特征包括形状、纹理、颜色等底层视觉特征,同时还有尺度不变特征变换、局部二值模式、方向梯度直方图等局部不变特征,这些特征能应用于大部分的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于spark的图像处理方法,其特征在于,包括:提取待处理图像的图像特征;将所述图像特征进行聚类分析,构建视觉词袋模型,得到视觉词袋特征向量;在所述待处理图像中划分不同的尺度空间,构建图像空间金字塔模型;将所述视觉词袋特征向量输入至所述图像空间金字塔模型,得到所述待处理图像的图像特征信息。2.根据权利要求1所述的一种基于spark的图像处理方法,其特征在于,所述提取待处理图像的图像特征包括:利用高斯差分函数将所述待处理图像进行卷积,构建尺度空间,得到所述待处理图像在不同尺度空间下的特征空间值;将所述特征空间值相减,得到图像高斯差分特征点;根据所述图像高斯差分特征点,建立图像高斯差分金字塔,计算图像极值点;根据所述图像高斯差分特征点与所述图像极值点之间的距离,计算图像极值,得到图像高斯差分特征点位置信息;根据所述图像高斯差分特征点位置信息,计算所述图像高斯差分特征点的方向梯度,得到图像高斯差分特征点描述子。3.根据权利要求2所述的一种基于spark的图像处理方法,其特征在于,在所述计算所述图像高斯差分特征点的方向梯度前,包括:旋转图像坐标轴,将所述图像坐标轴的x轴的方向与所述图像高斯差分特征点的方向对齐;将所述图像划分为面积相等的n个图像块,分别计算n个所述图像块的方向梯度直方图,并将所述梯度方向直方图累加,得到n个种子点;将所述n个种子点作为所述图像高斯差分特征点描述子。4.根据权利要求3所述的一种基于spark的图像处理方法,其特征在于,所述构建视觉词袋模型包括:将所述图像高斯差分特征点描述子进行聚类分析,得到N类聚类图像;将视觉单词作为N类所述聚类图像的中心,并将所述视觉单词聚合,得到视觉词袋模型;所述视觉单词的数量用于指示所述视觉词袋模型的大小;将所述视觉词袋模型进行降维处理,得到视觉词袋特征向量。5.根据权利要求4所述的一种基于spark的图像处理方法,其特征在于,所述将所述图像特征进行聚类分析包括:从所述待处理图像中随机选取k个点作为原始质心,将k个所述原始质心聚类得到k类质心集合;根据所述待处理图...

【专利技术属性】
技术研发人员:陈金源
申请(专利权)人:合肥追善网络科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1