苏州奇梦者科技有限公司专利技术

苏州奇梦者科技有限公司共有47项专利

  • 本发明公开了一种基于改进BSRNN的个性化语音增强方法及系统,所述方法包括以下步骤:使用短时傅里叶变换获得语音的频谱;使用频带分割模块将获得的语音频谱分为若干个子频带,经过批归一化和全连接层压缩到同一特征维度后拼接送入频带序列建模模块;...
  • 本发明公开了一种适用于本地扩声的啸叫抑制方法及系统,所述方法包括以下步骤:对输入音频信号进行预处理,包括预加重和傅立叶变换;将傅立叶变换后的数据送入啸叫检测模块进行啸叫检测;将数据和啸叫检测的结果送入自适应滤波器对信号进行啸叫抑制;将啸...
  • 本发明公开了用于回声消除的改进自适应步长的NLMS方法,包括以下步骤:计算输入信号的回声泄漏比例;归一化缩放回声泄漏比例;使用缩放后的回声泄漏比例加入到NLMS计算好的步长中对步长进行微调以更新滤波器参数;使用更新后的滤波器对信号进行二...
  • 本发明提供了一种开放式音频特性测试方法和系统,适用于开放空间的电声器件音频特性测试方案,降低测试成本,提高测试效率,扩大测试覆盖度,方法包括:将参考电声器件和待测电声器件以及对应的标准收音装置或放音装置布置在开放空间中的固定预设位置上;...
  • 本发明涉及一种基于超声三维手势定位的人机交互方法及系统,其中方法包括:基于IFFT/FFT的超声信号生成和发射;基于频率脉冲响应加权平均计算加权平均距离、极坐标序列,定义速度近似指标,估计超声三维手势定位;生成二维手势移动轨迹;利用定位...
  • 本发明公开了一种基于超声的多目标二维室内定位系统及方法,该系统包括:超声信号生成模块,用于得到超声数字信号并以固定的时间周期重复播放;特征提取模块,用于对超声数字信号进行处理,得到深度神经网络模块的输入特征;深度神经网络模块,用于对输入...
  • 本发明公开一种实时语音关键词检测方法及系统,该方法包括以下步骤:对输入音频进行分帧、特征提取,组成固定时长的片段级特征序列,输入含有空白检测的声学编码器模块,得到去除空白信息的二级声学向量;通过敏感词偏置的文本预测模块获取融合敏感词信息...
  • 本发明涉及一种高效低延迟的声音事件检测的模型及其训练方法,采用Vit作为模型骨干,具有更强的信息抽取能力,相较于卷积结构具有更高效的矩阵运算效率,对声学表征的时域、频域进行独立建模,可以根据设备性能灵活选定输入序列的长度,极大地减小模型...
  • 本发明公开了一种超轻量远距离的静态手势识别方法,包括以下步骤:将捕获到的视频帧送入人体检测模型进行人体定位,获得人体区域图像;将所有人体区域图像送入目标手势检测模型来对目标手势进行定位,获得目标手势区域图像;将所有目标手势区域图像送入目...
  • 本发明涉及一种高效低延迟的在线说话人日志系统及其训练方法,从模型结构和模型训练方法着手,对TSVAD模型进行改进,包括利用RepVGG作为TSVAD的骨干网络,在训练时使用多残差支路来最大限度保留模型的非线性,在推理时则融合各残差支路来...
  • 本发明提供了一种超声辅助的声纹身份识别方法,提高了声纹识别的鲁棒性和可靠性,且不会显著增加硬件成本,也不会涉及用户隐私问题,播放超声信号
  • 本申请提供了一种语音合成方法
  • 本发明公开了一种会议摄像头的发言人追踪方法、系统及存储介质,该方法包括:步骤1:人脸检测,获取视频帧画面里的所有人脸边界框;步骤2:人脸追踪,获取所有人脸边界框的追踪轨迹;步骤3:人脸说话动作识别,获取人脸说话动作得分;步骤4:后处理判...
  • 本发明公开一种实现声学级联设备麦克风数据传输同步的方法,包括以下步骤:打开主控设备和级联节点设备的麦克风,采集空间声学信号,级联节点设备向主控设备发送所采集的信号;主控设备发射声信号;计算声信号在主控设备所采集数据和每台级联节点设备所发...
  • 本发明提供了一种语音信号信噪比估计方法、系统,只需要带噪语音信号,并且可以估计瞬时信噪比,所估计的信噪比可以更好地反映应用在目标信号上的关注焦点,包括以下步骤:从输入的带噪语音信号中检测出包含语音信号的片段;对于包含语音信号的片段,估计...
  • 本发明公开了一种轻量高效的课堂学生起立坐下检测方法及系统,该方法包括以下步骤:步骤1:人头检测;步骤2:人头追踪;步骤3:后处理判决,判断是否有起立或者坐下的动作。本发明提供的轻量高效的课堂学生起立坐下检测方法及系统中,针对密集学生和复...
  • 本发明提供了一种声学级联系统的同步方法,其通过对声学级联的扬声器进行补偿,实现了扬声器播放内容的同步,包括步骤:主控设备打开麦克风并通知每个节点设备进行录音;主控设备扬声器播放声学信号S1,空闲P1时间;第i台节点设备D
  • 本发明公开了一种物体活动感知系统、方法、装置以及存储介质,该系统包括:超声发射模块,用于持续发射超声波信号;超声接收模块,用于持续接收空间传播的声波信号并进行处理,得到多通道超声波信号;超声预处理模块;超声定位模块,用于计算活动物体的运...
  • 本发明公开了一种基于超声微动检测的噪声下语音识别优化方法及系统,该方法包括以下步骤:超声发射模块持续发送超声信号;超声接收模块持续接收超声信号;对接收到的超声信号进行预处理,得到活动物体反射波的差频信号;根据得到的差频信号,检测特定距离...
  • 本发明公开了一种多模态融合的凌空轨迹输入系统和方法,该系统包括:视觉采集模块,用于采集特定视角范围内的视频图像;超声发射模块,用于播放人耳可听音频和特殊设计的超声信号;超声采集模块,用于采集人耳可听音频和空间的超声信号;手指跟踪模块,与...