一种基于图像的地点识别方法技术

技术编号:24939380 阅读:27 留言:0更新日期:2020-07-17 21:14
本发明专利技术涉及一种基于图像的地点识别方法,包括以下步骤:1)采集图像、初步提取特征;2)初始化;3)求解特征提取权重矩阵;4)对特征空间进行变换;5)随机生成隐藏层映射函数的输入权重向量与输入偏置;6)生成隐藏层输出函数;7)生成隐藏层输出矩阵;8)初始化输出权重矩阵;9)输出权重矩阵迭代优化;10)使用训练完成的预测模型识别地点类型。该发明专利技术仅采用了四层的人工神经网络,相比于深度神经网络具有更小的模型体积、更快的训练速度,同时引入了特征提取层以保证特征提取的性能,提升了分类准确度。

【技术实现步骤摘要】
一种基于图像的地点识别方法
本专利技术属于机器人
,特别是涉及一种基于图像的地点识别方法。
技术介绍
目前,随着人工智能的发展,移动智能机器人被广泛地应用于工业、军事和服务等领域,且发挥着越来越重要的作用。因此,对智能机器人认知环境的能力提出了越来越高的要求。机器人只有在知道自身位置和工作环境的前提下,才能安全有效地进行自主运动。视觉系统能够为机器人提供最丰富的感知信息,同时也最接近人类感知环境的方式。近年来,基于视觉的机器人自定位问题吸引了大量的研究人员,同时也取得了丰硕的研究成果。对于这类问题,往往称之为地点分类问题。在文献“CN103810500A一种基于有监督学习概率主题模型的地点图像识别方法”中提出了一种基于有监督学习概率主题模型的地点图像识别方法,目的在于更好地解决地点图像识别中由于不同光照和角度、事物变化和运动导致的不确定问题,以及原有LDA模型中随主题数目增加图像的识别率出现过拟合现象进而影响图像的识别率的问题。对于特征提取部分,采用了SIFT对图像局部特征进行检测并生成“词袋”特征,这种人工提取特征的手段具有一定的局限性,其区分性往往较弱。文献“CN110209859A地点识别及其模型训练的方法和装置以及电子设备”公开了一种地点识别及其模型训练的方法和装置、计算机可读存储介质以及电子设备。方法包括:基于CNN模型的第一部分提取样本图像的局部特征;基于CNN模型的第二部分将局部特征聚合成具有第一维数的特征向量;基于CNN模型的第三部分得到特征向量的压缩表示向量,压缩表示向量具有小于第一维数的第二维数;以及以使得多个图像对应的压缩表示向量之间的距离最小化为目标,调整第一至第三部分的模型参数,直至得到满足预设条件的CNN模型。利用CNN模型可以显著提高提取特征的效率,然而深度神经网络的引入不可避免地导致运算速度慢、耗费资源等问题。相关的工作可见“CN107967457A一种适应视觉特征变化的地点识别与相对定位方法及系统”与“CN102609719A基于改进概率主题模型的地点图像识别方法”。
技术实现思路
本专利技术克服现有技术的不足,提出一种基于图像的地点识别方法,其过程如下:步骤1、采集大量的场景图像,得到一系列图像对进行初步特征提取得到的特征向量集合,即样本集合对进行标记,得到对应的类别标签其中,为Ni维行向量,为No维行向量,Ni为初步提取特征的维度,No为地点类别的数量,因此类别集合为如果样本xk的类别为中的第c类,则yk的第c个元素为1,其余为0;表示实数域,k为1到n的正整数,n为样本总数,No与Ni也分别表示输出层与输入层神经元数量,为正整数;步骤2、初始化:令迭代步t=0,根据实际情况人工设定最大迭代步T为大于1的正整数,人工设定拉式乘子λ>0为正实数,隐藏层节点数Nh>0为大于3的正整数,设定损失系数C>0为正实数;令t=0步的中间变量vt,dt=0;步骤3、求解特征提取权重矩阵α:其中,上标T表示矩阵转制,I为单位阵,为原始样本矩阵;步骤4、对特征空间进行变换:其中,为变换后的样本矩阵;步骤5、随机生成输入权重向量与输入偏置:随机生成隐藏层映射函数的输入权重向量与输入偏置如下:随机生成Nh个a,得到随机生成Nh个b,得到步骤6、计算隐藏层输出函数:其中,G(a,b,x)为激活函数,x表示样本;步骤7、计算隐藏层输出矩阵H:H=[h(x1),…,h(xn)]T步骤8、初始化输出权重矩阵βt:βt=H*Y其中,H*表示H的伪逆矩阵;步骤9、输出权重矩阵迭代优化:首先令βt+1=(HTH+λI)-1(HTY+λ(vt+dt)+βt),然后令其中soft为软阈值函数;接着计算dt+1=dt-(βt+1-vt+1);最后令t自增1,如果t>T,则令并跳至步骤10,否则跳至步骤9;步骤10、将新的场景图像初步提取特征后得到其特征向量x,然后进行特征变换,得到变换后的样本接着计算即可获取该场景图像所对应的地点类别。在上述方法中,其中,所涉及的激活函数G(a,b,x)为:或者其中,步骤1和10中初步特征提取方法采用自动编码器、或采用视觉词典。其中,所述自动编码器包括至少一个卷积层和一个池化层。专利技术在仅采用了四层的人工神经网络,相比于深度神经网络具有更小的模型体积、更快的训练速度,同时引入了特征提取层以保证特征提取的性能,提升了分类准确度。附图说明图1为本专利技术方法流程图;具体实施方式下面结合实例对本专利技术作进一步描述,但本专利技术的保护范围并不限于此。如图1所示,本专利技术包括以下步骤:步骤1、采集大量的场景图像,得到一系列图像对进行初步特征提取得到的特征向量集合,即样本集合对进行标记,得到对应的类别标签其中,为Ni维行向量,为No维行向量,Ni为初步提取特征的维度,No为地点类别的数量,因此类别集合为如果样本xk的类别为中的第c类,则yk的第c个元素为1,其余为0;表示实数域,k为1到n的正整数,n为样本总数,No与Ni也分别表示输出层与输入层神经元数量,为正整数;步骤2、初始化:令迭代步t=0,根据实际情况人工设定最大迭代步T为大于1的正整数,人工设定拉式乘子λ>0为正实数,隐藏层节点数Nh>0为大于3的正整数,设定损失系数C>0为正实数;令t=0步的中间变量vt,dt=0;步骤3、求解特征提取权重矩阵α:其中,上标T表示矩阵转制,I为单位阵,为原始样本矩阵;步骤4、对特征空间进行变换:其中,为变换后的样本矩阵;步骤5、随机生成输入权重向量与输入偏置:随机生成隐藏层映射函数的输入权重向量与输入偏置如下:随机生成Nh个a,得到随机生成Nh个b,得到步骤6、计算隐藏层输出函数:其中,G(a,b,x)为激活函数,x表示样本;步骤7、计算隐藏层输出矩阵H:H=[h(x1),…,h(xn)]T步骤8、初始化输出权重矩阵βt:βt=H*Y其中,H*表示H的伪逆矩阵;步骤9、输出权重矩阵迭代优化:首先令βt+1=(HTH+λI)-1(HTY+λ(vt+dt)+βt),然后令其中soft为软阈值函数;接着计算dt+1=dt-(βt+1-vt+1);最后令t自增1,如果t>T,则令并跳至步骤10,否则跳至步骤9;步骤10、将新的场景图像初步提取特征后得到其特征向量x,然后进行特征变换,得到变换后的样本接着计算即可获取该场景图像所对应的地点类别。在上述方法中,优选地,所涉及的激活函数G(a,b,x)为:再次优选地,所涉及的激活函数G(a,b,x)为:进一步,优选地,步骤1和10中初步特征提取方法采用自动编码器本文档来自技高网
...

【技术保护点】
1.一种基于图像的地点识别方法,其特征在于,包括以下步骤:/n步骤1、采集大量的场景图像,得到一系列图像

【技术特征摘要】
1.一种基于图像的地点识别方法,其特征在于,包括以下步骤:
步骤1、采集大量的场景图像,得到一系列图像对进行初步特征提取得到的特征向量集合,即样本集合对进行标记,得到对应的类别标签其中,为Ni维行向量,为No维行向量,Ni为初步提取特征的维度,No为地点类别的数量,因此类别集合为如果样本xk的类别为中的第c类,则yk的第c个元素为1,其余为0;表示实数域,k为1到n的正整数,n为样本总数,No与Ni也分别表示输出层与输入层神经元数量,为正整数;
步骤2、初始化:令迭代步t=0,根据实际情况人工设定最大迭代步T为大于1的正整数,人工设定拉式乘子λ>0为正实数,隐藏层节点数Nh>0为大于3的正整数,设定损失系数C>0为正实数;令t=0步的中间变量vt,dt=0;
步骤3、求解特征提取权重矩阵α:



其中,上标T表示矩阵转制,I为单位阵,为原始样本矩阵;
步骤4、对特征空间进行变换:



其中,为变换后的样本矩阵;
步骤5、随机生成输入权重向量与输入偏置:
随机生成隐藏层映射函数的输入权重向量与输入偏置如下:随机生成Nh个a,得到随机生成Nh个b,得到
步骤6、计算隐藏层输出函数:



其中,G(a,b,x)为激活函数,x表示样本;
步骤7、计算隐藏层输出矩阵H:
H=[h(x1),…,h(...

【专利技术属性】
技术研发人员:刘阳刘珂
申请(专利权)人:安徽果力智能科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1