基于语音控制电梯的方法、装置、设备、系统及介质制造方法及图纸

技术编号:26036753 阅读:25 留言:0更新日期:2020-10-23 21:15
本申请公开了一种基于语音控制电梯的方法、装置、设备、系统及介质,属于人机交互领域。本申请一些实施例能够应用在多人共同乘坐语音电梯的场景。本申请实施例通过从混合了不同用户语音的音频流中,分离出每个用户对应的一个语音信号,对分离出的n个语音信号分别进行语音识别和意图识别,从而识别出多个用户的意图,根据这些意图中的目标意图控制电梯,从而支持多人同时语音控制电梯,避免不同用户的语音指令相互干扰的情况,解决了由于多个用户的语音相互重叠导致语音识别率低下的问题,提高了语音电梯的语音识别率,显著提高了控制语音电梯的成功率。

【技术实现步骤摘要】
基于语音控制电梯的方法、装置、设备、系统及介质
本申请涉及人机交互领域,特别涉及一种基于语音控制电梯的方法、装置、设备、系统及介质。
技术介绍
在电梯这种使用频率极高、使用人群复杂且人口密度较高的场景,通过语音交互的方式来控制电梯,相比于传统的点击电梯按钮来控制电梯的方式而言,避免了接触电梯按钮而被病毒感染的风险,具有卫生、安全且高效等优势。因此,如何基于语音控制电梯已经成为本领域的研究热点。相关技术中,会从电梯中采集音频流;对音频流进行语音识别,得到语句;对语句进行意图识别,得到语句表示的意图;根据意图控制电梯执行相应的指令。在电梯这种特殊的人机交互环境下,往往会有很多人共同乘坐电梯,使得多人同时语音控制电梯成为一个普遍的场景。但是在多人同时语音控制电梯的场景下采用上述方法时,会出现语音识别率不高的问题,进而影响了控制电梯的成功率。
技术实现思路
本申请实施例提供了一种基于语音控制电梯的方法、装置、设备、系统及介质,能够提高语音识别率,进而提高控制电梯的成功率。所述技术方案如下:一方面,提供了一种基于语音控制电梯的方法,所述方法包括:对音频流进行分离,得到n个语音信号,所述音频流的声源包括共同乘坐电梯的多个用户,所述n个语音信号中每一个语音信号的声源为所述多个用户中的一个用户,所述n为大于1的正整数;对所述n个语音信号分别进行语音识别,得到多个语句;对所述多个语句分别进行意图识别,得到多个意图;根据所述多个意图中的至少一个目标意图控制所述电梯。可选地,所述对所述n个语音信号分别进行语音识别,包括:根据所述n个语音信号中每个语音信号的语音活性检测VAD结束时间,对所述n个语音信号分别进行语音识别。可选地,所述音频流的时间长度小于或等于150毫秒。可选地,所述对所述多个语句分别进行意图识别,得到多个意图之后,所述方法还包括:根据目标意图策略,对所述多个意图进行处理,得到所述至少一个目标意图。可选地,所述多个意图包括第一意图和第二意图,所述第一意图和所述第二意图指示同一类型的指令,所述至少一个目标意图包括第一目标意图,所述根据目标意图策略,对所述多个意图进行处理,得到所述至少一个目标意图,包括:对所述第一意图和所述第二意图进行合并,得到所述第一目标意图;对所述第一意图对应的槽位信息和所述第二意图对应的槽位信息进行合并,得到所述第一目标意图对应的槽位信息;所述根据所述多个意图中的至少一个目标意图控制所述电梯,包括:根据所述第一目标意图以及所述第一目标意图对应的槽位信息控制所述电梯。可选地,所述多个意图包括第三意图和第四意图,所述第三意图和所述第四意图指示不同类型的指令,所述至少一个目标意图包括第二目标意图,所述根据目标意图策略,对所述多个意图进行处理,得到所述至少一个目标意图,包括:确定所述第三意图对应的语音信号在时间窗口中的第一语音结束点;确定所述第四意图对应的语音信号在所述时间窗口中的第二语音结束点;根据所述第一语音结束点和所述第二语音结束点,从所述第三意图和所述第四意图中选择所述第二目标意图,所述第二目标意图在所述第三意图和所述第四意图中对应的语音结束点最晚。可选地,所述根据所述多个意图中的至少一个目标意图控制所述电梯,包括:根据第一目标意图和第二目标意图控制所述电梯,所述第一目标意图是根据所述多个意图中指示同一类型指令的不同意图处理得到的,所述第二目标意图是根据所述多个意图中指示不同类型指令的不同意图处理得到的。可选地,所述对所述n个语音信号分别进行语音识别,得到多个语句之后,所述方法还包括:识别所述多个语句中的噪声语句,所述噪声语句是指与控制电梯无关的语句;过滤掉所述多个语句中的噪声语句。可选地,所述多个语句包括第一语句,所述识别所述多个语句中的噪声语句,包括:对所述第一语句进行命名实体识别,得到所述第一语句中的槽位信息;采用标签替换所述第一语句中的槽位信息,得到第二语句;根据所述第二语句在种子语句库中搜索,得到第一种子语句,所述第一种子语句包括所述标签;使用所述第一语句中的槽位信息填充所述第一种子语句,得到第二种子语句;若所述第二种子语句与所述第一语句之间的语义相似度低于阈值,确定所述第一语句为所述噪声语句。可选地,所述对所述n个语音信号分别进行语音识别,包括:并行地对所述n个语音信号分别进行语音识别;所述对所述多个语句分别进行意图识别,包括:并行地对所述多个语句分别进行意图识别。另一方面,提供了一种基于语音控制电梯的装置,所述装置包括:分离模块,用于对音频流进行分离,得到n个语音信号,所述音频流的声源包括共同乘坐电梯的多个用户,所述n个语音信号中每一个语音信号的声源为所述多个用户中的一个用户,所述n为大于1的正整数;语音识别模块,用于对所述n个语音信号分别进行语音识别,得到多个语句;意图识别模块,用于对所述多个语句分别进行意图识别,得到多个意图;控制模块,用于根据所述多个意图中的至少一个目标意图控制所述电梯。可选地,所述语音识别模块,用于根据所述n个语音信号中每个语音信号的语音活性检测VAD结束时间,对所述n个语音信号分别进行语音识别。可选地,所述音频流的时间长度小于或等于150毫秒。可选地,所述装置还包括:处理模块,用于根据目标意图策略,对所述多个意图进行处理,得到所述至少一个目标意图。可选地,所述多个意图包括第一意图和第二意图,所述第一意图和所述第二意图指示同一类型的指令,所述至少一个目标意图包括第一目标意图,所述处理模块,用于对所述第一意图和所述第二意图进行合并,得到所述第一目标意图;对所述第一意图对应的槽位信息和所述第二意图对应的槽位信息进行合并,得到所述第一目标意图对应的槽位信息;所述控制模块,用于根据所述第一目标意图以及所述第一目标意图对应的槽位信息控制所述电梯。可选地,所述多个意图包括第三意图和第四意图,所述第三意图和所述第四意图指示不同类型的指令,所述至少一个目标意图包括第二目标意图,所述处理模块,用于确定所述第三意图对应的语音信号在时间窗口中的第一语音结束点;确定所述第四意图对应的语音信号在所述时间窗口中的第二语音结束点;根据所述第一语音结束点和所述第二语音结束点,从所述第三意图和所述第四意图中选择所述第二目标意图,所述第二目标意图在所述第三意图和所述第四意图中对应的语音结束点最晚。可选地,所述控制模块,用于根据第一目标意图和第二目标意图控制所述电梯,所述第一目标意图是根据所述多个意图中指示同一类型指令的不同意图处理得到的,所述第二目标意图是根据所述多个意图中指示不同类型指令的不同意图处理得到的。可选地,所述意图识别模块,还用于识别所述多个语句中的噪声语句,所述噪声语句是指与控制电梯无关的语句;过滤掉所述多个语句中的噪声语句。本文档来自技高网...

【技术保护点】
1.一种基于语音控制电梯的方法,其特征在于,所述方法包括:/n对音频流进行分离,得到n个语音信号,所述音频流的声源包括共同乘坐电梯的多个用户,所述n个语音信号中每一个语音信号的声源为所述多个用户中的一个用户,所述n为大于1的正整数;/n对所述n个语音信号分别进行语音识别,得到多个语句;/n对所述多个语句分别进行意图识别,得到多个意图;/n根据所述多个意图中的至少一个目标意图控制所述电梯。/n

【技术特征摘要】
1.一种基于语音控制电梯的方法,其特征在于,所述方法包括:
对音频流进行分离,得到n个语音信号,所述音频流的声源包括共同乘坐电梯的多个用户,所述n个语音信号中每一个语音信号的声源为所述多个用户中的一个用户,所述n为大于1的正整数;
对所述n个语音信号分别进行语音识别,得到多个语句;
对所述多个语句分别进行意图识别,得到多个意图;
根据所述多个意图中的至少一个目标意图控制所述电梯。


2.根据权利要求1所述的方法,其特征在于,所述对所述n个语音信号分别进行语音识别,包括:
根据所述n个语音信号中每个语音信号的语音活性检测VAD结束时间,对所述n个语音信号分别进行语音识别。


3.根据权利要求2所述的方法,其特征在于,所述音频流的时间长度小于或等于150毫秒。


4.根据权利要求1所述的方法,其特征在于,所述对所述多个语句分别进行意图识别,得到多个意图之后,所述方法还包括:
根据目标意图策略,对所述多个意图进行处理,得到所述至少一个目标意图。


5.根据权利要求4所述的方法,其特征在于,所述多个意图包括第一意图和第二意图,所述第一意图和所述第二意图指示同一类型的指令,所述至少一个目标意图包括第一目标意图,所述根据目标意图策略,对所述多个意图进行处理,得到所述至少一个目标意图,包括:
对所述第一意图和所述第二意图进行合并,得到所述第一目标意图;
对所述第一意图对应的槽位信息和所述第二意图对应的槽位信息进行合并,得到所述第一目标意图对应的槽位信息;
所述根据所述多个意图中的至少一个目标意图控制所述电梯,包括:
根据所述第一目标意图以及所述第一目标意图对应的槽位信息控制所述电梯。


6.根据权利要求4所述的方法,其特征在于,所述多个意图包括第三意图和第四意图,所述第三意图和所述第四意图指示不同类型的指令,所述至少一个目标意图包括第二目标意图,所述根据目标意图策略,对所述多个意图进行处理,得到所述至少一个目标意图,包括:
确定所述第三意图对应的语音信号在时间窗口中的第一语音结束点;
确定所述第四意图对应的语音信号在所述时间窗口中的第二语音结束点;
根据所述第一语音结束点和所述第二语音结束点,从所述第三意图和所述第四意图中选择所述第二目标意图,所述第二目标意图在所述第三意图和所述第四意图中对应的语音结束点最晚。


7.根据权利要求1或4所述的方法,其特征在于,所述根据所述多个意图中的至少一个目标意图控制所述电梯,包括:
根据第一目标意图和第二目标意图控制所述电梯,所述第一目标意图是根据所述多个意图中指示同一类型指令的不同意图处理得到的,所述第二目标意图是根据所述多个意图中指示不同类型指令的不同意图处理得到的。


8.根据权利要求1所述的方法,其特征在于,所述对所述n个语音信号分别进行语...

【专利技术属性】
技术研发人员:陈孝良李良斌李智勇
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1