基于听觉场景分析的室内环境区域定位系统及方法技术方案

技术编号：19818128 阅读：32 留言：0更新日期：2018-12-19 13:27

本发明专利技术公开了一种基于听觉场景分析的室内环境区域级定位系统及方法，系统包括通过无线网络连接服务器端和客户端；首先生成室内房间级的定位结果，然后根据该结果，计算该房间内的区域级定位，最终给出准确的区域内定位结果。该定位方法，包括离线阶段建立位置声纹数据库和在线阶段进行声信号的匹配两个步骤。只需要在在线阶段录制所处位置的10s音频，将音频文件转化为位置声纹，上传ABS结果，下载服务器端筛选的房间地图信息，就可以在客户端快速准确的解算出位置信息。由于ABS结果与房间地图信息，都是轻量级的数据，因此，该方法解决了现有室内区域级定位精度低，运算量庞大的问题，同时借助联觉现象，辅以CRP色彩声图呈现方式，提升用户定位体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于听觉场景分析的室内环境区域定位系统及方法
本专利技术涉及室内定位方法，具体是一种基于听觉场景分析(ASA)的室内环境区域定位系统及方法，在人机交互、听觉感知与应用、位置感知与服务等场景中有重要的应用价值。
技术介绍
环境声是除语音声和音乐声之外的所有可听声的总称。从信号分析的角度看，环境声信号是非结构化数据，其特性相比语声和乐声要复杂得多，从其中提取有效特征也更加困难。然而，环境声是物理声源自然产生的，具有反映声源特征的复杂声学结构，由于室内环境的物理结构不同，室内布局的不同，室内不同区域的环境声信号具有不同的时频域特性。针对这一难题，结合环境声的特性，我们基于听觉场景分析结论，提出一种室内环境多维声纹的构建方法，用以实现室内区域定位。常用声信号特征可分为两类：时域特征(如：短时能量、短时平均过零率等)和频域特征(如：MFCC、LPCC等)。己有大量通过环境声信号时频域特征提取与结合，进行声信号识别、建筑物结构监控、室内房间级定位的研究，但是，许多环境声极其相似，因此，利用环境声信号作为位置指纹，实现室内区域定位的精度通常较低。目前，解决这类问题的最佳选择是在定位系统的离线阶段，通过群智感知获取大量环境音频源数据，结合聚类算法，实现区域定位，但引入数据多样性及数据冗余问题，影响了定位系统性能。
技术实现思路
为了降低室内环境中，环境声信号特征对声纹匹配度的影响，提高室内环境区域定位精度，同时，兼顾定位终端通用性的考虑；并针对同一室内环境中环境声极其相似，导致现有室内环境区域定位方法在复杂室内环境中定位精度差的问题。本专利技术提出了一种基于听觉场景分析实现室...

【技术保护点】
1.基于听觉场景分析的室内环境区域定位系统，包括服务器端和客户端，服务器端与客户端通过无线网络连接；其特征在于：所述服务器端包括依次连接的智能手机、听觉场景分析模块ASA、声学背景谱模块ABS、色彩声图模块CRP；还包括连接听觉场景分析模块和色彩声图模块的皮尔逊系数提簇模块；通过智能手机的麦克风录制所处位置的10s环境音频输入听觉场景分析模块，再经声学背景谱模块处理，处理ABS的算法为RNN，用来获取房间级的定位结果；所述客户端包括从服务器端下载并筛选的室内环境地图、VAR算法、ASA和ABS、以及测试音频；将测试音频在客户端经ASA和ABS提取测试音频的多维声纹，通过无线网络上传ABS的结果至服务器，由服务器端下载匹配的室内环境地图与VAR算法连接，VAR算法根室内环境地图据解算出多维声纹所处物理位置信息；所述的室内环境区域定位系统，首先生成室内房间级的定位结果，然后根据该结果，计算该房间内的区域级定位，最终给出准确的区域内定位结果。

【技术特征摘要】
1.基于听觉场景分析的室内环境区域定位系统，包括服务器端和客户端，服务器端与客户端通过无线网络连接；其特征在于：所述服务器端包括依次连接的智能手机、听觉场景分析模块ASA、声学背景谱模块ABS、色彩声图模块CRP；还包括连接听觉场景分析模块和色彩声图模块的皮尔逊系数提簇模块；通过智能手机的麦克风录制所处位置的10s环境音频输入听觉场景分析模块，再经声学背景谱模块处理，处理ABS的算法为RNN，用来获取房间级的定位结果；所述客户端包括从服务器端下载并筛选的室内环境地图、VAR算法、ASA和ABS、以及测试音频；将测试音频在客户端经ASA和ABS提取测试音频的多维声纹，通过无线网络上传ABS的结果至服务器，由服务器端下载匹配的室内环境地图与VAR算法连接，VAR算法根室内环境地图据解算出多维声纹所处物理位置信息；所述的室内环境区域定位系统，首先生成室内房间级的定位结果，然后根据该结果，计算该房间内的区域级定位，最终给出准确的区域内定位结果。2.根据权利要求1所述的基于听觉场景分析的室内环境区域定位系统，进行室内环境区域定位的方法，包括离线阶段建立位置声纹数据库和在线阶段进行声信号的匹配两个步骤；其特征在于：所述离线阶段建立位置声纹数据库，具体方法是：首先，基于听觉场景分析模块结论，提取室内声信号的色度谱，响度谱和功率谱构成室内环境声的多维声纹；其次，采用声学背景谱模块，对功率谱信号提取其第5百分位功率数据作为房间的...

【专利技术属性】
技术研发人员：宋浠瑜，王玫，仇洪冰，周陬，昂晨，李凯华，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人