一种声音定向传输方法、系统、电子设备及存储介质技术方案

技术编号:28983249 阅读:33 留言:0更新日期:2021-06-23 09:31
本发明专利技术公开了一种声音定向传输方法、系统、电子设备及存储介质,所述声音定向传输方法通过调用摄像头获取预定范围内声音接收端的图像;预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;调整声音传输端向所述位置坐标进行声音播放;本发明专利技术可以智能判断接收端位置,并能根据接收端运动方向控制播放的音源方向;可在多音源环境中,对特定群组,分组进行音源定向播放。

【技术实现步骤摘要】
一种声音定向传输方法、系统、电子设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种声音定向传输方法、系统、电子设备及存储介质。
技术介绍
声波(20Hz-20kHz)的定向传播可通过指向性换能器或换能器阵列实现,换能器辐射面的最大尺度与发射的声波波长决定了所发射的声束的指向性开角的大小,即换能器尺寸越大,声波频率越高,则指向性越好,实现定向声传播的效果也越好,而在可听声范围内实现声音的定向传输需要的扬声器尺寸很大,波束开角很宽甚至呈半球形,且在波束开角范围外仍然存在旁瓣带来的声波泄露问题,无法满足现今对高指向性扬声器的需求。因此,利用高频声波的高指向性和非线性声学的自解调原理来实现可听声定向传播,此时高频扬声器发射高指向性超声波,声波在空气中传播时的非线性效应可使声场中产生差频、和频、倍频声波。由于高频声波的高吸收特性,最终传播一段距离后只剩下频率较低的差频声波,该差频即是待发射的高指向性可听声。定向声技术的发展逐渐成熟,在传媒广告领域中的应用也越来越多,尤其像博览馆展览馆企业展厅等文化科博项目、大型展会,商场超市,汽车等场合中得到广泛应用。但目前实现定向声播放的条件还存在着一定局限性,在声音播放过程中只能够对固定的区域进行定向播放,而不能智能的判断周围环境,根据环境中特定对象的移动而达到完全的定点定向音源播放效果。
技术实现思路
本专利技术的目的在于提供一种声音定向传输方法、系统、电子设备及存储介质,通过结合人脸识别的人工智能判断技术,定位需要播放音源的人群,从而实现声音定向传输的方法。第一方面,本专利技术实施例提供了一种声音定向传输方法,所述声音定向传输方法包括以下步骤:调用摄像头获取预定范围内声音接收端的图像;预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。可选地,所述声音传输端为多个,其中每个声音传输端均配置图像获取装置,根据距离声音传输端最近的位置坐标,进行声音传输端的方向调整。可选地,声音预处理包括;通过相位控制阵列方法将音频进行合成;以波源为圆心,取相同的半径画半圆,得到各波的波前;根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。第二方面,本专利技术实施例提供了一种声音定向传输系统,其特征在于,所述声音定向传输系统包括:图像获取子系统,用于调用摄像头获取预定范围内声音接收端的图像;位置坐标确定子系统,用于对所述图像进行人脸识别以实时确定接收端的位置坐标;调整子系统,用于调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。可选地,所述调整子系统包括,声音预处理模块,所述声音预处理模块具体包括:音频合成单元,通过相位控制阵列方法将音频进行合成;波前获取单元,用于以波源为圆心,取相同的半径画半圆,得到各波的波前;主波传输单元,用于根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。可选地,所述声音传输端包括多个固定播放地点的音箱,其中每个音箱均配置有摄像头。可选地,控制具体位置的音箱进行主增益方向的播放。可选地,固定播放地点的音箱分为两排,两排音箱面向接收端且呈锐角排列。第三方面,本专利技术提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器通过运行所述可执行指令以实现上述的方法。第四方面,本专利技术提供了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述方法的步骤。有益效果本专利技术提出了一种声音定向传输方法、系统、电子设备及存储介质,所述声音定向传输方法通过调用摄像头获取预定范围内声音接收端的图像;预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;调整声音传输端向所述位置坐标进行声音播放;其中,所述声音是经过预处理的,可以智能判断接收端位置,并能根据接收端运动方向控制播放的音源方向;可在多音源环境中,对特定群组,分组进行音源定向播放。附图说明图1为本专利技术实施例的一种声音定向传输方法的流程图;图2为本专利技术实施例的声音预处理方法的流程图;图3为本专利技术实施例的声音定向传输系统的结构框图;图4为本专利技术实施例的声音预处理模块的结构框图;图5为本专利技术实施例的音箱排列方式示意图;图6为本专利技术实施例的一种电子设备的结构框图。具体实施方式下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的目的在于提供一种声音定向传输方法、系统、电子设备及存储介质,通过结合人脸识别的人工智能判断技术,定位需要播放音源的人群,从而实现声音定向传输的方法。下面结合附图说明和具体实施例对本专利技术作进一步描述:图1示出了本专利技术实施例的一种声音定向传输方法的流程图,如图1所示,所述声音定向传输方法包括以下步骤:S20、调用摄像头获取预定范围内声音接收端的图像;S40、预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;S60、调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。本实施例提出了一种声音定向传输方法所述声音定向传输方法通过调用摄像头获取预定范围内声音接收端的图像;对所述图像进行人脸识别以实时确定接收端的位置坐标;调整声音传输端向所述位置坐标进行声音播放;其中,所述声音是经过预处理的;可以智能判断接收端位置,并能根据接收端运动方向控制播放的音源方向。在一些实施例中,所述声音传输端为多个,其中每个声音传输端均配置图像获取装置,根据距离声音传输端最近的位置坐标,进行声音传输端的方向调整。具体地,如图2所示,声音预处理包括;S601、通过相位控制阵列方法将音频进行合成;S602、以波源为圆心,取相同的半径画半圆,得到各波的波前;S603、根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。本实施例通过相位控制阵列方法将音频进行合成,基于惠更斯原理,当有很多波源并且每个点波源产生波的频率一致时相当于各个点波源为子波的波源,点波源以平面排列,则产生波面;以波源为圆心,取相同的半径画半圆,得到各波的波前,根据接收端的位置坐标确定的一个主波,将主波对位置坐标方向输送,实现可控制的定向音源播放方法。在一些实施例中,所述声音传输端为多个,其中每个声音传输端均配置图像获取装置(例如摄像头),将多个传输端进行分组,根据距离每组传输端最近的位置坐标,进行声音传输端的方向调整。可在多音源环本文档来自技高网...

【技术保护点】
1.一种声音定向传输方法,其特征在于,所述声音定向传输方法包括以下步骤:/n调用摄像头获取预定范围内声音接收端的图像;/n预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;/n调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。/n

【技术特征摘要】
1.一种声音定向传输方法,其特征在于,所述声音定向传输方法包括以下步骤:
调用摄像头获取预定范围内声音接收端的图像;
预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;
调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。


2.根据权利要求1所述的声音定向传输方法,其特征在于,所述声音传输端为多个,其中每个声音传输端均配置图像获取装置,根据距离声音传输端最近的位置坐标,进行声音传输端的方向调整。


3.根据权利要求1所述的声音定向传输方法,其特征在于,声音预处理包括;
通过相位控制阵列方法将音频进行合成;
以波源为圆心,取相同的半径画半圆,得到各波的波前;
根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。


4.一种声音定向传输系统,其特征在于,所述声音定向传输系统包括:
图像获取子系统,用于调用摄像头获取预定范围内声音接收端的图像;
位置坐标确定子系统,用于对所述图像进行人脸识别以实时确定接收端的位置坐标;
调整子系统,用于调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。<...

【专利技术属性】
技术研发人员:樊天放
申请(专利权)人:辽宁省视讯技术研究有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1