声源定位方法、装置、智能设备及存储介质制造方法及图纸

技术编号：21032034 阅读：28 留言：0更新日期：2019-05-04 04:38

本发明专利技术涉及语音信号处理技术领域，公开了一种声源定位方法、装置、智能设备及存储介质，所述方法包括：根据从语音采集装置获取的脉码编码调制PCM数据确定是否触发定位操作，每一帧PCM数据携带有帧号；从触发定位操作的PCM数据中提取帧号；将帧号发送给语音采集装置，以使语音采集装置根据帧号对应的PCM数据计算声源方位。本发明专利技术实施例提供的技术方案，提高了声源定位的准确性，从而实现远场拾音，提高语音识别的质量，提升用户体验。

Sound Source Location Method, Device, Intelligent Equipment and Storage Media

The invention relates to the technical field of speech signal processing, and discloses a sound source location method, device, intelligent device and storage medium. The method includes: determining whether to trigger a positioning operation according to PCM data acquired from a speech acquisition device, each frame of PCM data carries a frame number; extracting a frame number from PCM data of trigger positioning operation; transmitting a frame number to a speech. The voice acquisition device makes the voice acquisition device calculate the sound source orientation according to the PCM data corresponding to the frame number. The technical scheme provided by the embodiment of the present invention improves the accuracy of sound source location, realizes far-field pickup, improves the quality of speech recognition and improves the user experience.

全部详细技术资料下载

【技术实现步骤摘要】
声源定位方法、装置、智能设备及存储介质
本专利技术涉及语音信号处理
，尤其涉及一种声源定位方法、装置、智能设备及存储介质。
技术介绍
目前，市场上有越来越多的产品具有语音交互功能，例如智能音箱、机器人等智能设备。这些智能设备在接收到唤醒指令时，会从睡眠状态转为工作状态，并开始通过语音采集装置采集语音信号，进而可以对该语音信号进行识别和解析，从而响应该语音信号对应的交互指令。显然，在产品功能实现过程中，声源定位是非常重要的，只有准确地定位用户声源方位，才能准确地获取用户发出的语音信号，才能进行正确的响应行为。上述具有语音交互功能的智能设备在接收到唤醒指令后，由智能设备内的控制装置中安装的软件系统的SDK层将唤醒消息通过localsocket的方式发送给语音采集装置。由于消息的传递具有时延性，因此，语音采集装置在收到唤醒消息后，会往后回溯固定的时间以找到唤醒时刻用户的语音信息，并基于唤醒时刻用户的语音信息计算用户的方位，并将方位信息通过localsocket的方式反馈给SDK层。由于唤醒功能一般在智能设备中实现，而智能设备受限于成本等原因，硬件规格往往不高。当智...

【技术保护点】
1.一种声源定位方法，其特征在于，包括：根据从语音采集装置获取的脉码编码调制PCM数据确定是否触发定位操作，每一帧PCM数据携带有帧号；从触发定位操作的PCM数据中提取帧号；将所述帧号发送给所述语音采集装置，以使所述语音采集装置根据所述帧号对应的PCM数据计算声源方位。

【技术特征摘要】
1.一种声源定位方法，其特征在于，包括：根据从语音采集装置获取的脉码编码调制PCM数据确定是否触发定位操作，每一帧PCM数据携带有帧号；从触发定位操作的PCM数据中提取帧号；将所述帧号发送给所述语音采集装置，以使所述语音采集装置根据所述帧号对应的PCM数据计算声源方位。2.根据权利要求1所述的方法，其特征在于，所述从触发定位操作的PCM数据中提取帧号，包括：从触发定位操作的每一帧PCM数据中提取第一预设位置处的音频数据的最后一位数据；按预设顺序连接提取的最后一位数据得到所述每一帧PCM数据的帧号。3.根据权利要求1或2所述的方法，其特征在于，所述每一帧PCM数据携带有校验号；在从触发定位操作的PCM数据中提取帧号之前，还包括：从触发定位操作的PCM数据中提取校验号，并验证提取的校验号与预设校验号是否相同；所述从触发定位操作的PCM数据中提取帧号，包括：若提取的校验号与预设校验号相同，则从触发定位操作的PCM数据中提取帧号。4.根据权利要求3所述的方法，其特征在于，所述从触发定位操作的PCM数据中提取校验号，包括：从触发定位操作的每一帧PCM数据中提取第二预设位置处的音频数据的最后一位数据；按预设顺序连接提取的最后一位数据得到所述每一帧PCM数据的校验号。5.一种声源定位方法，其特征在于，包括：为每一帧脉码编码调制PCM数据添加帧号...

【专利技术属性】
技术研发人员：郑垦，
申请(专利权)人：北京猎户星空科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人