The embodiment of the present invention discloses a method, device, electronic device and storage medium for acquiring the amplitude of a sound area, in which the method includes: acquiring the voice data of the target sound area in real time, and the voice data includes audio signals corresponding to multiple sampling points; storing the audio signal by the following ways: storing the amplitude of the current audio signal to be stored with each stored one The amplitude of the audio signal is compared, and the storage of the current audio signal is selected according to the comparison result. The current amplitude of the target audio area is calculated according to the amplitude of all the audio signals that have been stored. The embodiment of the invention can accurately acquire the amplitude of the voice area, so as to accurately locate the source voice area of the voice data according to the amplitude of the voice area, thereby solving the problem of false wake-up caused by insufficient isolation of the four-tone area, and providing the basis of amplitude data for correcting the false wake-up of the voice engine, with less calculation and saving system resources.
【技术实现步骤摘要】
音区幅值获取方法、装置、电子设备及存储介质
本专利技术实施例涉及车载系统
,尤其涉及一种音区幅值获取方法、装置、电子设备及存储介质。
技术介绍
传统的车载语音识别技术方案都是围绕司机一个人服务的,前端麦克风的角度是对准主驾驶位来设计的,传统的车载导航、音乐、电话等应用功能也都是围绕司机来展开设计的,只需获取并识别司机的语音信号。随着应用需求的增多,车载四音区方案逐渐走入人们的视野。车载四音区方案是一款满足车内全员使用的车载语音系统。全车分为前后左右四个音区,能够对四个音区进行独立拾音,因此,只需识别出语音信号是来自哪个音区,即可实现针对不同的音区实现不同功能的语音控制。由于汽车内的四个音区的麦克风所在的位置是处于同一个空间内,虽然可以通过麦克风模组算法对四个位置的语音制造一定的声音隔离度,但是四个位置说话的声音还是会有一部分传到其它位置的麦克风,从而影响对不同音区的语音信号的识别,例如,一个位置上通过语音唤醒某种功能,车辆上的语音引擎会误识别为其他三个位置同时唤醒。现有技术中,通常会依据车载四音区幅值等参数,并利用特定算法来识别获取到的语音信号是来自于哪个音 ...
【技术保护点】
1.一种音区幅值获取方法,其特征在于,所述方法包括:实时采集目标音区的语音数据,所述语音数据包括多个采样点对应的音频信号;通过如下方式对所述音频信号进行存储:将待存储的当前音频信号的幅值与已存储的各音频信号的幅值相比较,并根据比较结果选择是否存储所述当前音频信号;根据完成存储的全部音频信号的幅值计算所述目标音区的当前音区幅值。
【技术特征摘要】
1.一种音区幅值获取方法,其特征在于,所述方法包括:实时采集目标音区的语音数据,所述语音数据包括多个采样点对应的音频信号;通过如下方式对所述音频信号进行存储:将待存储的当前音频信号的幅值与已存储的各音频信号的幅值相比较,并根据比较结果选择是否存储所述当前音频信号;根据完成存储的全部音频信号的幅值计算所述目标音区的当前音区幅值。2.根据权利要求1所述的方法,其特征在于,所述将待存储的当前音频信号的幅值与已存储的各音频信号的幅值相比较,并根据比较结果选择是否存储所述当前音频信号,包括:将所述多个采样点对应的音频信号依次插入到预先创建的容器中;在插入过程中,如果当前音频信号的幅值大于所述容器中已插入的音频信号的幅值的最小值,则将所述当前音频信号的幅值替换所述最小值;如果当前音频信号的幅值小于或等于所述容器中已插入的音频信号的幅值的最小值,则将所述当前音频信号丢弃。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述插入过程中,为每个音频信号的幅值绑定对应的插入时间戳;按照预设的清除周期,根据所述插入时间戳检测所述容器中是否存在超过预设丢弃时间的目标音频信号;如果存在,则将目标音频信号的幅值在所述容器中对应的元素值置零。4.根据权利要求3所述的方法,其特征在于,所述根据完成存储的全部音频信号的幅值计算所述目标音区的当前音区幅值,包括:计算所述容器中元素值非零的所有音频信号的幅值的均值,并依据该均值计算目标音区的当前音区幅值。5.一种音区幅值获取装置,其特征在于,所述装置包括:采集模块,用于实时采集目标音区的语音数据,所述语音数据包括多个采样点对应的音频信号;存储模块,用于通过如下方式对所述音频信号进行存储:...
【专利技术属性】
技术研发人员:彭汉迎,欧阳能钧,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。