苏州思必驰信息科技有限公司专利技术

苏州思必驰信息科技有限公司共有720项专利

  • 本发明公开一种发言人确定方法,应用于电子设备,该方法包括:接收摄像头所采集的场景图像数据;分析所述场景图像数据中是否存在做出预设动作的目标发言人;当所述场景图像数据中存在做出预设动作的目标发言人时,则增强接收自所述目标发言人的语音数据。...
  • 本发明实施例提供一种用于语音交互的回复方法。该方法包括:基于用户的语音请求,将语音请求的音频以及智能设备的回调URL发送至云服务器;以云服务器反馈的第一回复对用户进行应答;接收云服务器基于回调URL返回的第二回复对用户的语音请求进行响应...
  • 本发明公开一种人机交互方法和装置,方法包括:基于摄像设备,采集第一连续图像帧;利用第一连续图像帧识别人脸属性,识别人脸属性与摄像设备的距离值,判定距离值是否在有效距离内;当判定距离值在有效距离内,利用人脸属性确定人脸朝向角度,判定人脸朝...
  • 本发明公开一种声纹识别方法和装置,其中,声纹识别方法,包括:响应于获取到用户的第一语音信息,对所述第一语音信息进行特征提取以获取第二语音信息;将所述第二语音信息与所述用户的声纹模板进行打分,判断得分是否高于预设阈值;若高于预设阈值,将所...
  • 本发明实施例提供一种TTS预合成方法。该方法包括:根据电子设备中的语料名称的动态变化,利用固定句式以及对应的动态变化后的语料名称,在线进行动态TTS预合成。本发明实施例还提供一种TTS预合成系统。本发明实施例动静态结合预生成TTS,在使...
  • 本发明公开一种电子导游设备的伴游控制方法、装置及伴游机器人,在该方法中,采集提问音频数据和所述电子导游设备的位置信息;基于所述提问音频数据和所述位置信息,确定针对所述提问音频数据的答复多媒体数据;播放所述答复多媒体数据。由此,实现了在伴...
  • 本发明公开一种模块化代码开发方法和装置,其中,模块化代码开发方法,包括:响应于用户在语音人工智能平台打开流程设计界面,将平台的开发者开发的多个流程控制组件加载到流程设计界面上;响应于用户将至少一个流程控制组件移动至流程设计区域并对至少一...
  • 本发明公开一种语义解析方法和装置,其中,语义解析方法,包括:将长语音识别文本实时送入文本缓存,在所述文本缓存上施加可变长度滑动窗口,将所述滑动窗口内的文本输入至语义解析系统进行语义解析;如果所述滑动窗口内的文本没有命中所述语义解析系统中...
  • 本发明实施例提供一种实时语音识别方法。该方法包括:在令牌传递过程中,确定采集到的实时语音中从第一帧到第N帧的每一帧的至少一个令牌;确定当前最佳识别结果路径,当前最佳识别结果的路径由第一帧到第N帧的至少N个令牌连接构成;选择当前最佳识别结...
  • 本发明公开一种车辆解锁方法和装置,其中,车辆解锁方法,包括:响应于感应到车辆感应装置,开启车辆语音识别系统检测用户的语音指令,判断所述语音指令是否为有效指令,其中,所述车辆配备有可穿戴的所述车辆感应装置,所述车辆还包括所述车辆语音识别系...
  • 本发明公开一种人脸识别方法和装置,其中,人脸识别方法,包括:控制拍摄装置循环采集人脸图片并将所述人脸图片送入消息列队,经由图片处理线程循环从所述消息队列中取人脸图片进行处理;判断所述消息队列内的所述人脸图片的数量是否达到预设阈值;若所述...
  • 本发明公开一种婴儿啼哭检测方法,包括:响应于接收的音频信号,经由婴儿啼哭声音分类器输出婴儿啼哭声音的置信度,其中,所述婴儿啼哭声音分类器通过对至少一个婴儿啼哭的声音基于深度学习模型进行训练得到;判断所述婴儿啼哭声音的置信度是否小于预设的...
  • 本发明公开一种针对用户个性化服务的语音交互方法及装置。在该方法中,获取用户个性化语音服务请求;确定所述用户个性化语音服务请求所对应的目标用户声纹信息;根据所述目标用户声纹信息,确定相应的目标用户语音模型;基于所述目标用户语音模型处理所述...
  • 本发明实施例提供一种回声消除方法。该方法包括:第一电子设备利用蓝牙通讯模块与第二电子设备建立连接;通过蓝牙通讯模块的第一蓝牙通道将音源发送至第二电子设备的音频解码电路进行播放;通过蓝牙通讯模块的第二蓝牙通道将音源发送至第二电子设备的回声...
  • 本发明公开一种用于蓝牙耳机的检测方法及装置,检测装置包括:控制待测蓝牙耳机的播放器播放预先内置的第一测试音频并同步开启待测蓝牙耳机的麦克风进行录音,其中,第一测试音频为包含预设音频能量的音频;响应于麦克风录音获取的待测蓝牙耳机的播放器内...
  • 本发明公开一种离线识别xbnf的编写和维护方法和装置,其中,离线识别xbnf的编写和维护方法,包括:遍历预设的语料表格,判断遍历的当前栏是否是语义槽栏;若当前栏是语义槽栏,获取所述语义槽栏中的语义槽定义信息,将所述语义槽定义信息写入xb...
  • 本发明公开一种数据权限校验方法和装置,其中,数据权限校验方法,包括:响应于所述网关接收到数据请求,解析所述数据请求获取第一字段、第二字段和第三字段;判断所述第一字段是否与预设接口的配置信息中的第一字段匹配;若匹配,读取所述数据请求的第二...
  • 本发明实施例提供一种定向语音的增强方法。该方法包括:利用m个麦克风的麦克风阵列将空间划分成n个区间,对n个区间进行信号定向增强;采集n个区间中n条通道的语音信号;将n条通道的语音信号输入至通道选择模块,若不存在指定的收音区间时,基于神经...
  • 本发明公开一种语音数据同步方法和装置,其中,语音数据同步方法,包括:响应于发现至少一个语音设备与当前语音设备在同一局域网下,建立所述当前语音设备与所述至少一个语音设备的通信连接,并从所述当前语音设备与所述至少一个语音设备中推举出主设备或...
  • 本发明公开一种多语种语音交互方法和装置,其中,多语种语音交互方法,包括:响应于获取的音频,将所述音频送入混合语言模型进行识别,其中,所述混合语言模型中训练了多种语种的切换语种命令词并存储在本地;基于所述识别结果,判断所述音频中是否存在切...