一种基于SSD的视觉室内定位系统技术方法技术方案

技术编号:28668065 阅读:15 留言:0更新日期:2021-06-02 02:42
本发明专利技术公开了一种基于SSD的视觉室内定位系统技术方法,步骤为:1)收集站点(商场、博物馆)中的每个地标的图像,并使用地标ID手动注释图像中每个地标的边界框。使用这些图像与标记构建地标数据库;2)使用图像对这些图像进行大小调整,投影变换,亮度调节和图像模糊来扩充数据库,生成更多训练的图像,防止过度拟合;3)改善SSD网络使他更快更准确的识别地标ROI;4)将数据库里的数据输入网络进行训练;5)手机拍摄视频将视频信息传入服务器中;6)服务器收集到手机端拍摄的图像后使用基于ROI跟踪的有效关键帧选择方法对潜在的地标、边界和关键帧进行选择,采用改进的SSD来检测地标,得到地标概率;7)服务器处理相关数据估计位置,并将位置信息发送给手机端。该方法通过使用视觉识别进行室内定位。

【技术实现步骤摘要】
一种基于SSD的视觉室内定位系统技术方法
本专利技术涉及视觉室内定位领域,具体是一种基于SSD的视觉室内定位系统技术方法
技术介绍
随着经济的快速发展,我过商场越来越多且越来越大,同时节假日去博物馆参观的人也越来越多。在大型博物馆与购物中心中,人们往往需要询问工作人员或自己慢慢寻找地标来寻找自己想要去的地方或是想去参观的展台。现有的GPS在室外有着良好的定位性能,但在室内GPS并不灵敏。目前比较主流的室内定位技术有WIFI、蓝牙、RFID等。这些技术大多通过用户手持接收或者发信器接收会发送信号给射频标签,通过发送接收的时间使用三角定位算法来实现室内定位。但这些射频信号很容易受到信号反射与设备的影响。此外,他们必须部署和维护大量设备,例如Wi-Fi接入点或蓝牙信标,这大大增加了此类本地化系统的部署和维护成本。近几年计算机视觉技术得到快速发展,基于视觉地标的室内定位最近在具有丰富功能的商业场所中受到了很多关注,因为地标在很长时间内相对稳定。现有技术经常要求用户在他/她的位置周围拍摄多个独立图像,并手动确认入围的地标。本方案提出使用计算机视觉技术来实现室内定位,只需要先采集图像数据构建数据库,用户就能通过手机操作来得知自己所在的位置。
技术实现思路
本专利技术提供一种基于SSD的视觉室内定位系统技术方法,该技术方案规避了射频信号很容易受到信号反射与设备的影响和必须部署和维护大量设备的问题。实现本专利技术目的技术方案是:一种基于SSD的视觉室内定位系统技术方法,包括数据库,web服务器、手机端。通过大量收集数据构建数据库,存放于服务器中。用户通过手机拍摄画面传入服务器,有服务筛选后进行定位,再将位置信息返还给用户。所述的数据库,为手机到的地标的训练图像构成的数据库。所述的手机端即智能手机。可在手机上查询医疗床的具体坐标。一种基于SSD的视觉室内定位系统技术方法,包括如下步骤:1)收集站点(商场、博物馆)中的每个地标的图像,并使用地标ID手动注释图像中每个地标的边界框。使用这些图像与标记构建地标数据库;2)使用图像对这些图像进行大小调整,投影变换,亮度调节和图像模糊来扩充数据库,生成更多训练的图像,防止过度拟合;3)改善SSD网络使他更快更准确的识别地标;4)将数据库里的数据输入网络进行训练;5)手机拍摄视频将视频信息传入服务器中;6)服务器收集到手机端拍摄的图像后使用基于ROI跟踪的有效关键帧选择方法对潜在的地标、边界和关键帧进行选择,采用改进的SSD来检测地标,得到地标概率。7)服务器处理相关数据估计位置,并将位置信息发送给手机端;附图说明图1一种基于SSD的视觉室内定位系统技术方法流程图;图2一种基于SSD的视觉室内定位系统技术方法系统结构图;图3定位角度方位关系图。具体实施方式下面结合附图和实施例对本
技术实现思路
做进一步阐述,但不是对本专利技术的限定。实施例:SSD的视觉室内定位1)收集站点(商场、博物馆)中的每个地标的图像,并使用地标ID手动注释图像中每个地标的边界框。使用这些图像与标记构建地标数据库;2)使用图像对这些图像进行大小调整,投影变换,亮度调节和图像模糊来扩充数据库,生成更多训练的图像,防止过度拟合;其中亮度调节使用对比度拉伸,图像模糊使用高斯模糊。使用设置需要调节到的最大最小像素值使用对比度拉伸进行亮度调节,对比度拉伸对比度拉拉伸公式如下:其中Imax、Imin是原始图像的最小值和最大值,MAX、MIN是要拉伸到的最大值和最小值。使用高斯函数求出权重再进行卷积计算来模糊图像,高斯方程如下:其中r为模糊半径,N表示N维空间。3)改善SSD网络使他更快更准确的识别地标。将SSD的基础特征提取网络VGG-16换位ResNet-101,并使用分离卷积的思想先逐通道卷积再逐点卷积,加快网络速度。4)将数据库里的数据输入网络进行训练。d)在训练阶段,一个产生室内场地中K个地标的概率和所有背景类,另一个产生边界框回归偏移量的编码。e)使用检测跟踪策略来监视视频中的ROI,而不是逐帧检测它们。首先在起始帧(不一定是第一帧)中选择ROI。然后采用核相关过滤器(KCF)来有效跟踪以下帧(每秒约172帧)中每个检测到的ROI。当跟踪的ROI移出视图时,针对每个特定的ROI的跟踪都会停止。然后,我们将每个跟踪中的这些跟踪的ROI分组在一起。这些跟踪的ROI称为ROI序列。生成ROI序列后,将SSD作为另一个起始帧在下一帧中初始化ROI,然后采用过滤器(KCF)跟踪,如图3所示。这样,我们就可以提取ROI,并在ROI中选择那些帧。f)当SSD检测到具有潜在地标的ROI时,它还会输出每个ROI属于特定地标的可能性。选取可能性最大的地标。5)将手机端视频送入服务器。6)服务器收集到手机端拍摄的图像后使用基于ROI跟踪的有效关键帧选择方法对潜在的地标、边界和关键帧进行选择,采用改进的SSD来检测地标,得到地标概率。7)服务器处理相关数据估计位置,并将位置信息发送给手机端。其中定位公式为:给定视频中检测到的两个关键帧,两个地标(z1,z2)的坐标以及用户面对它们时的指南针读数(θ1和θ2)连接地标qs和用户位置的直线表示为ls:Asx+Bsx+Cs=0。指南针读数是用户方位与北之间的相对角度(如图3)。我们计算As,Bs与Cs如下:其中Rs是传递到ls的方向向量的旋转矩阵:x12确定的客户位置定义如下:本文档来自技高网
...

【技术保护点】
1.一种基于SSD的视觉室内定位系统技术方法,其特征在于,包括如下步骤:/n1)收集站点(商场、博物馆)中的每个地标的图像,并使用地标ID手动注释图像中每个地标的边界框。使用这些图像与标记构建地标数据库;/n2)使用图像对这些图像进行大小调整,投影变换,亮度调节和图像模糊来扩充数据库,生成更多训练的图像,防止过度拟合;/n3)改善SSD网络使他更快更准确的识别地标;/n4)将数据库里的数据输入网络进行训练;/n5)手机拍摄视频将视频信息传入服务器中;/n6)服务器收集到手机端拍摄的图像后使用基于ROI跟踪的有效关键帧选择方法对潜在的地标、边界和关键帧进行选择,采用改进的SSD来检测地标,得到地标概率;/n7)服务器处理相关数据估计位置,并将位置信息发送给手机端。/n

【技术特征摘要】
1.一种基于SSD的视觉室内定位系统技术方法,其特征在于,包括如下步骤:
1)收集站点(商场、博物馆)中的每个地标的图像,并使用地标ID手动注释图像中每个地标的边界框。使用这些图像与标记构建地标数据库;
2)使用图像对这些图像进行大小调整,投影变换,亮度调节和图像模糊来扩充数据库,生成更多训练的图像,防止过度拟合;
3)改善SSD网络使他更快更准确的识别地标;
4)将数据库里的数据输入网络进行训练;
5)手机拍摄视频将视频信息传入服务器中;
6)服务器收集到手机端拍摄的图像后使用基于ROI跟踪的有效关键帧选择方法对潜在的地标、边界和关键帧进行选择,采用改进的SSD来检测地标,得到地标概率;
7)服务器处理相关数据估计位置,并将位置信息发送给手机端。


2.根据权利要求1所述的一种基于SSD的视觉室内定位系统技术方法,其特征在于,步骤2)中,使用图像对这些图像进行大小调整,投影变换,亮度调节和图像模糊来扩充数据库,生成更多训练的图像,防止过度拟合;其中亮度调节使用对比度拉伸,图像模糊使用高斯模糊。
使用设置需要调节到的最大最小像素值使用对比度拉伸进行亮度调节,对比度拉伸对比度拉拉伸公式如下:



其中Imax、Imin是原始图像的最小值和最大值,MAX、MIN是要拉伸到的最大值和最小值。
使用高斯函数求出权重再进行卷积计算来模糊图像,高斯方程如下:



其中r为模糊半径,N表示N维空间。


3.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员:李冀秦子钦罗笑南
申请(专利权)人:桂林慧谷人工智能产业技术研究院
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1