【技术实现步骤摘要】
耳机的自动启动控制方法、装置、电子设备及存储介质
本专利技术涉及语音识别领域,特别是一种耳机的自动启动控制方法、装置、电子设备及存储介质。
技术介绍
在日常的消防作业过程中,救援人员和执勤人员与指挥系统的信息及时交流是一个问题,现有技术中提出了采用骨传导耳机来解决指挥系统与救援人员和执勤人员之间的及时交流的问题。由于骨传导耳机的特性,利用脸部骨头传递的振动信号来传动声音,所以能够在嘈杂的环境中听到比一般耳机更加清楚的声音,并且由于骨传导耳机的佩戴方式,不会堵塞耳膜接收外接的声波,所以不会影响使用者听到来自周围的声音,使得使用者能够在在火场中根据周围的环境变化迅速的作出判断,避免受到伤害。现有的很多消防对讲设备,需要使用者按下PTT按键之后才能开启语音通话功能,在一些特殊的场合情况下,使用者无法解放出手去按下PTT按键时就显得非常的不方便;并且现有技术也公开了通过语义识别来控制耳机启动的技术方案,通过识别使用者说出话自动唤醒耳机开启工作,将使用者所说的话自动的发出,从而更好的解放使用者的双手。但具备语义识别的骨传导耳机而言,骨传导耳机包括骨传导喇叭和骨传导麦克风,虽 ...
【技术保护点】
1.一种耳机的自动启动控制方法,其特征在于,所述方法基于听觉场景分析理论CASA和深度学习技术,所述方法包括以下步骤:接收原始声音信号输入;从原始声音信号中分离为多个部分声音信号;基于噪音训练得到的神经网络模型,将所述部分声音信号分批次与神经网络模型中学习过的噪音信号对比,判断相同或相似标记为噪音,反之标记为人声;仅在识别到标记为人声的部分声音信号后,启动发送功能将标记为人声的部分声音信号自动发出。
【技术特征摘要】
1.一种耳机的自动启动控制方法,其特征在于,所述方法基于听觉场景分析理论CASA和深度学习技术,所述方法包括以下步骤:接收原始声音信号输入;从原始声音信号中分离为多个部分声音信号;基于噪音训练得到的神经网络模型,将所述部分声音信号分批次与神经网络模型中学习过的噪音信号对比,判断相同或相似标记为噪音,反之标记为人声;仅在识别到标记为人声的部分声音信号后,启动发送功能将标记为人声的部分声音信号自动发出。2.根据权利要求1所述的耳机的自动启动控制方法,其特征在于,所述方法还包括:抑制或过滤掉标记为噪音的所述部分声音信号。3.根据权利要求1所述的耳机的自动启动控制方法,其特征在于,所述方法还包括:所述原始声音信号为复杂混合声源中接收的声音信号。4.根据权利要求3所述的耳机的自动启动控制方法,其特征在于,所述方法还包括:所述部分声音信号为从复杂混合声源接收的声音信号中分离的单一声源的声音信号。5.根据权利要求4所述的耳机的自动启动控制方法,其特征在于,所述方法还包括:将所述单一声源的声音信号输入所述神经网络模型的函数中,得出判断结果,判断相同或相似标记为噪音,反之标记为人声。6.根据权利要求1至5任一项所述的耳机的自动启动控制方法,...
【专利技术属性】
技术研发人员:廖春生,吕凯,胡峰,苏纯剑,
申请(专利权)人:深圳市荣盛智能装备有限公司,广东寰易消防科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。