【技术实现步骤摘要】
地点识别及其模型训练的方法和装置以及电子设备
本专利技术涉及计算机
,特别涉及一种地点识别及其模型训练的方法和装置、计算机可读存储介质以及电子设备。
技术介绍
随着图像处理技术的进步,地点识别(PlaceRecognition)得到了越来越广泛的应用。例如,在地图应用中,通过地点识别可辨别相同的位置,从而修正地图建立过程中可能存在的地点和位置错误。又例如,在视频应用中,通过地点识别可对图像片段进行分类,据此对视频进行抽象和切分,以提取视频精华。再例如,地点识别还可用于各种移动端应用的增强现实(AugmentedReality,AR)功能,在用户使用移动端拍摄所看到的景物时,可通过地点识别确定对应的景物名称,然后触发相应的简介、AR浏览功能。地点识别主要面临条件变化、视角变化和效率要求三种挑战。为了应对这些困难,业内目前发展出三类实现方式。第一类方式是基于人工设计的描述子(Descriptor)对地点图像进行特征提取;这种方式对于视角变化具有较强的鲁棒性,但无法针对应用场景变化进行自动调整。第二类方式是使用预训练的卷积神经网络(ConvolutionalNeu ...
【技术保护点】
1.一种用于地点识别的模型训练方法,其特征在于,所述方法包括:基于卷积神经网络CNN模型的第一部分提取样本图像的局部特征,所述样本图像包括至少一组在同一地点拍摄的多个图像;基于所述CNN模型的第二部分将所述局部特征聚合成具有第一维数的特征向量;基于所述CNN模型的第三部分得到所述特征向量的压缩表示向量,所述压缩表示向量具有小于所述第一维数的第二维数;以及以使得所述多个图像对应的压缩表示向量之间的距离最小化为目标,调整所述第一部分、所述第二部分和所述第三部分的模型参数,直至得到满足预设条件的CNN模型。
【技术特征摘要】
1.一种用于地点识别的模型训练方法,其特征在于,所述方法包括:基于卷积神经网络CNN模型的第一部分提取样本图像的局部特征,所述样本图像包括至少一组在同一地点拍摄的多个图像;基于所述CNN模型的第二部分将所述局部特征聚合成具有第一维数的特征向量;基于所述CNN模型的第三部分得到所述特征向量的压缩表示向量,所述压缩表示向量具有小于所述第一维数的第二维数;以及以使得所述多个图像对应的压缩表示向量之间的距离最小化为目标,调整所述第一部分、所述第二部分和所述第三部分的模型参数,直至得到满足预设条件的CNN模型。2.如权利要求1所述的方法,其特征在于,所述的基于所述CNN模型的第三部分得到所述特征向量的压缩表示向量,包括:基于所述第三部分将所述特征向量投影至单位正交空间,得到所述压缩表示向量。3.如权利要求2所述的方法,其特征在于,所述第三部分为所述CNN模型中接收所述特征向量输入的全连接层,所述全连接层包括数量为所述第二维数的神经元,每个神经元的权重矩阵为单位向量且具有所述第一维数,所述神经元的权重矩阵之间满足正交关系。4.如权利要求3所述的方法,其特征在于,所述的调整所述第一部分、所述第二部分和所述第三部分的模型参数,包括:基于所述权重矩阵的正交约束项构建所述CNN模型的损失函数,所述正交约束项G的表达式为:G=sum(g(WTW-E))其中,W为所述神经元的权重矩阵,T表示矩阵转置,E为已知的单位向量,g表示对矩阵的各个元素求平方,sum表示求和。5.如权利要求1或3所述的方法,其特征在于,所述样本图像包括第一图像、拍摄地点与所述第一图像相同的多个第二图像、以及拍摄地点与所述第一图像不同的多个第三图像,所述特征向量包括与所述第一图像、所述第二图像和所述第三图像分别对应的第一特征向量、第二特征向量和第三特征向量,所述的调整所述第一部分、所述第二部分和所述第三部分的模型参数,还包括:基于所述第一特征向量与所述第二特征向量之间的第一距离、以及所述第一特征向量与所述第三特征向量之间的第二距离构建所述CNN模型的损失函数;以及将所述损失函数经所述CNN模型反向传播以更新所述模型参数,直至所述CNN模型满足预设的收敛条件。6.如权利要求5所述的方法,其特征在于,所述的基于所述第一特征向量与所述第二特征向量之间的第一距离、以及所述第一特征向量与所述第三特征向量之间的第二距离构建所述CNN模型的损失函数...
【专利技术属性】
技术研发人员:白栋栋,凌永根,刘威,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。