The invention discloses a sound source positioning method, device and storage medium, the method includes: acquiring each microphone position and a plurality of preset potential sound source orientations in the preset microphone array; acquiring the time delay of each potential sound source relative to each microphone pair according to each microphone position and each potential sound source orientation, wherein the microphone pair is composed of any two microphones; acquiring each microphone in real time Time domain signal collected by Kefeng; when the corresponding time domain signal collected by each microphone is obtained, the cross-correlation function of each microphone pair in the frame is obtained according to the corresponding time domain signal; the possible sound source orientation of the frame is obtained according to the time delay of each potential sound source relative to each microphone pair and the cross-correlation function of each microphone pair in the frame; the possible sound source direction of the frame is obtained according to the possible sound source side of the frame The source azimuth corresponding to the frame can be obtained by the covariance of bit, source azimuth of the previous frame and that of the previous frame. The invention solves the technical problems that the existing sound source positioning method has large calculation amount and poor anti-interference ability.
【技术实现步骤摘要】
声源定位方法、装置及计算机可读存储介质
本专利技术涉及声源定位领域,尤其涉及声源定位方法、装置及计算机可读存储介质。
技术介绍
随着人工智能产业的飞速发展,语音交互设备越来越多的出现在人们的生活当中,例如智能音箱、智能会议机等,其中声源定位和跟踪是语音交互中的关键技术,为多麦克风降噪和音视频产品交互等方向提供技术基础。但是目前的声源定位与跟踪方法存在计算量大和抗干扰能力差的问题,从而导致现有的技术运算速度慢,不适合在性能较低的嵌入式平台运行。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种声源定位方法、装置及计算机可读存储介质,旨在解决目前的声源定位与跟踪方法存在计算量大和抗干扰能力差的技术问题。为实现上述目的,本申请提供一种声源定位方法,包括步骤:获取预设麦克风阵列中各麦克风位置和预设的多个潜在声源方位;根据各麦克风位置和各潜在声源方位,获得每个潜在声源相对各麦克风对的时延,其中麦克风对由任意两个 ...
【技术保护点】
1.一种声源定位方法,其特征在于,包括步骤:/n获取预设麦克风阵列中各麦克风位置和预设的多个潜在声源方位;/n根据各麦克风位置和各潜在声源方位,获得每个潜在声源相对各麦克风对的时延,其中麦克风对由任意两个麦克风组成;/n实时获取各麦克风采集的时域信号;/n每获取到各麦克风采集到的对应的一帧时域信号时,根据对应的一帧时域信号,获得各麦克风对在该帧的互相关函数;/n根据每个潜在声源相对各麦克风对的时延和各麦克风对在该帧的互相关函数,获得该帧可能声源方位;/n获取前一帧声源方位和前一帧方位协方差,并根据该帧可能声源方位、前一帧声源方位和前一帧方位协方差,获得该帧对应的声源方位。/n
【技术特征摘要】
1.一种声源定位方法,其特征在于,包括步骤:
获取预设麦克风阵列中各麦克风位置和预设的多个潜在声源方位;
根据各麦克风位置和各潜在声源方位,获得每个潜在声源相对各麦克风对的时延,其中麦克风对由任意两个麦克风组成;
实时获取各麦克风采集的时域信号;
每获取到各麦克风采集到的对应的一帧时域信号时,根据对应的一帧时域信号,获得各麦克风对在该帧的互相关函数;
根据每个潜在声源相对各麦克风对的时延和各麦克风对在该帧的互相关函数,获得该帧可能声源方位;
获取前一帧声源方位和前一帧方位协方差,并根据该帧可能声源方位、前一帧声源方位和前一帧方位协方差,获得该帧对应的声源方位。
2.如权利要求1所述的声源定位方法,其特征在于,所述根据各麦克风位置和各潜在声源方位,获得每个潜在声源相对各麦克风对的时延,其中麦克风对由任意两个麦克风组成的步骤包括:
获取所述麦克风阵列的预设采样率;
根据各麦克风位置、各潜在声源方位、所述麦克风阵列的预设采样率和时延计算公式获得每个潜在声源相对任意两个麦克风组成的麦克风对的时延tkij;
其中tkij为第k个潜在声源相对第i个麦克风和第j个麦克风组成的麦克风对的时延,k=1,2...K,K为预设的潜在声源数量,i=1,2...M-1,j=i+1...M,M为预设麦克风阵列中麦克风数量,(xi,yi,0)为第i个麦克风位置,(xj,yj,0)为第j个麦克风位置,为第k个潜在声源方位,C0为声速,Fs为麦克风阵列的预设采样率。
3.如权利要求2所述的声源定位方法,其特征在于,所述每获取到各麦克风采集到的对应的一帧时域信号时,根据对应的一帧时域信号,获得各麦克风对在该帧的互相关函数的步骤包括:
每采集到一帧时域信号时,对各麦克风采集到的一帧时域信号进行傅里叶转换,获得各麦克风在该帧对应的频域信号;
根据麦克风在该帧对应的频域信号以及公式获得各麦克风对的互功率谱,其中Pij为第i个麦克风和第j个麦克风组成的麦克风对的互功率谱,为第i个麦克风在该帧频域信号的共轭,Fj(w)为第j个麦克风在该帧的频域信号;
对各麦克风对的互功率谱Pij进行傅里叶逆变换,获得各麦克风对的时域互相关函数Rij(t),其中Rij(t)为第i个麦克风和第j个麦克风组成的麦克风对的互相关函数,t=1,2...2N-1,N为一帧信号的采样点数。
4.如权利要求3所述的声源定位方法,其特征在于,所述根据每个潜在声源相对各麦克风对的时延和各麦克风对在该帧的互相关函数,获得该帧可能声源方位的步骤包括:
根据每个潜在声源相对麦克风对的时延tkij和各麦克风对在该帧的互相关函数Rij(t),获得各潜在声源相对麦克风对的所有互相关值Rij(N-1+tkji),其中Rij(N-1+tkji)为第k个潜在声源相对第i个麦克风和第j个麦克风组成的麦克风对的互相关值;
根据各潜在声源对麦克风对的互相关值Rij(N-1+tkij)和公式获得各潜在声源相对麦克风阵列的所有互...
【专利技术属性】
技术研发人员:张洁,
申请(专利权)人:深圳壹秘科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。