苏州奇梦者科技有限公司专利技术

苏州奇梦者科技有限公司共有35项专利

  • 本发明公开了一种会议摄像头的发言人追踪方法、系统及存储介质,该方法包括:步骤1:人脸检测,获取视频帧画面里的所有人脸边界框;步骤2:人脸追踪,获取所有人脸边界框的追踪轨迹;步骤3:人脸说话动作识别,获取人脸说话动作得分;步骤4:后处理判...
  • 本发明公开一种实现声学级联设备麦克风数据传输同步的方法,包括以下步骤:打开主控设备和级联节点设备的麦克风,采集空间声学信号,级联节点设备向主控设备发送所采集的信号;主控设备发射声信号;计算声信号在主控设备所采集数据和每台级联节点设备所发...
  • 本发明提供了一种语音信号信噪比估计方法、系统,只需要带噪语音信号,并且可以估计瞬时信噪比,所估计的信噪比可以更好地反映应用在目标信号上的关注焦点,包括以下步骤:从输入的带噪语音信号中检测出包含语音信号的片段;对于包含语音信号的片段,估计...
  • 本发明公开了一种轻量高效的课堂学生起立坐下检测方法及系统,该方法包括以下步骤:步骤1:人头检测;步骤2:人头追踪;步骤3:后处理判决,判断是否有起立或者坐下的动作。本发明提供的轻量高效的课堂学生起立坐下检测方法及系统中,针对密集学生和复...
  • 本发明提供了一种声学级联系统的同步方法,其通过对声学级联的扬声器进行补偿,实现了扬声器播放内容的同步,包括步骤:主控设备打开麦克风并通知每个节点设备进行录音;主控设备扬声器播放声学信号S1,空闲P1时间;第i台节点设备D
  • 本发明公开了一种物体活动感知系统、方法、装置以及存储介质,该系统包括:超声发射模块,用于持续发射超声波信号;超声接收模块,用于持续接收空间传播的声波信号并进行处理,得到多通道超声波信号;超声预处理模块;超声定位模块,用于计算活动物体的运...
  • 本发明公开了一种基于超声微动检测的噪声下语音识别优化方法及系统,该方法包括以下步骤:超声发射模块持续发送超声信号;超声接收模块持续接收超声信号;对接收到的超声信号进行预处理,得到活动物体反射波的差频信号;根据得到的差频信号,检测特定距离...
  • 本发明公开了一种多模态融合的凌空轨迹输入系统和方法,该系统包括:视觉采集模块,用于采集特定视角范围内的视频图像;超声发射模块,用于播放人耳可听音频和特殊设计的超声信号;超声采集模块,用于采集人耳可听音频和空间的超声信号;手指跟踪模块,与...
  • 本申请提供了一种声纹唤醒方法及系统,通过将说话人确认以及唤醒词确认这两大核心功能进行端到端集成,无需切出唤醒词再送入声纹模型,可以避免唤醒词切分不准确所造成的声纹提取的不准确。本方法中声纹确认以及唤醒词确认能够同时进行,从而避免了两段式...
  • 本发明公开了一种提高唤醒率的方法、系统、设备及存储介质,上述的提高唤醒率的系统包括超声波和语音提供模块、超声感知模块、超声定位模块、声源定位模块、目标声源方位确定模块、语音增强模块和语音唤醒模块;本发明通过接收超声波信号后分析超声波的多...
  • 本发明公开了一种提高唤醒率的方法、系统、设备及存储介质,上述的提高唤醒率的系统包括超声波和语音提供模块、超声感知模块、超声定位模块、声源定位模块、目标声源方位确定模块、语音增强模块和语音唤醒模块;本发明通过接收超声波信号后分析超声波的多...
  • 本申请提供了一种端到端语音转换模型及其训练方法、推理方法,该模型以条件变分编码器为基础,训练时将声学模型与声码器共同训练,避免训练与推理的不匹配。使用大规模预训练Hubert模型来提取内容信息表征,既可初步剥离内容表征中的说话人信息,也...
  • 本申请提供了一种端到端语音转换模型及其训练方法、推理方法,该模型以条件变分编码器为基础,训练时将声学模型与声码器共同训练,避免训练与推理的不匹配。使用大规模预训练Hubert模型来提取内容信息表征,既可初步剥离内容表征中的说话人信息,也...
  • 本发明公开了一种灵活离、在线声纹日志系统,包括在线分支,或在线分支和离线分支,在线分支的输出包括每个说话人对应的时间边界和每个说话人对应的声纹,通过离线分支能够获取精确至帧级别的说话人边界。本发明提供的灵活离、在线声纹日志系统,满足声纹...
  • 本发明公开了一种超声定位辅助的声场跟随系统及方法,所述系统包括:送音模块,所述送音模块由一组扬声器阵列组成,用于发射超宽带声学信号;收音模块,所述收音模块由一组麦克风阵列组成,用于接收超宽带声学信号;超声定位模块,所述超声定位模块利用收...
  • 本申请提供了一种远端会议装置的近端控制方法、远程会议系统及相关装置,其中方法包括:近端会议装置根据用户的控制操作,通过音频水印生成算法,将对应的控制指令以音频水印的方式嵌入到语音数据流中,通过上行通道传输给远端会议装置。远端会议装置从下...
  • 本发明公开了一种屏幕无接触触控方法及其系统,所述系统由以下单元组成:发射单元:所述发射单元用于发射预先设计的超声波信号;采集单元M1、M2:所述采集单元M1、M2用于接收超声波信号,均由至少两个超声接收器组成;计算单元:所述计算单元用于...
  • 本发明提供了一种触控定位系统及方法,其可有效实现触控笔的准确定位,提高定位精度;包括发射端和接收端,所述发射端中设置有信号发射模块,所述接收端中设置有信号接收模块,所述接收端中还设置有与所述信号接收模块连接的定位模块;其中,所述信号发射...
  • 本发明公开了多模型语音命令词的识别方法、系统、设备及储存介质,该识别方法包括如下步骤:基于需要支持的语音命令词划分后构建相应数量的模型以及各个模型支持的命令词;根据划分的结果得出系统运行时需要并行的模型最大数量,根据模型的最大数量创建线...
  • 本发明公开了一种设备状态控制方法、装置、设备和介质,上述装置包括发射模块、采集模块、超声感知模块、语音接收模块、语音检测模块、人脸识别模块和设备状态调整模块;本发明以超声感知为主导,首先通过超声感知判断物体是否活动即可对设备的状态进行自...