【技术实现步骤摘要】
本专利技术涉及人工智能,具体为基于语音差分处理的人机交互方法、系统、设备及介质。
技术介绍
1、人工智能技术飞速发展。技术上,深度学习等先进算法的突破极大提高了机器的学习能力。数据上,海量的网络和物联网数据为ai训练提供了丰富的素材。政策上,各国纷纷支持和投资ai研究,加速了技术成熟。社会对智能化服务的需求不断增长,推动了ai在多个领域的应用。此外,gpu等硬件的进步为复杂的ai计算提供了强大的动力。这些不仅推动了人工智能发展,也带来了一系列如就业变化、隐私保护、伦理道德等问题与挑战。
2、目前,在家庭环境下,用户希望通过语音指令控制机器人向左转,而在电子设备的声音以及其他声源的干扰下,导致传统系统识别出错,常出现错误识别为“向前进”或漏识别问题,进而导致响应故障。当家庭环境下存在多位客人来访,且用户向机器人下发语音指令的同时,多位客人发生声音较大的交流,导致用户的语音与客人交流语音发生重叠,机器人无法对重叠的语音进行准确区分,确定要执行的语音指令,从而无法执行用户下达的语音指令需要完成的动作。
3、此外,在家庭
...【技术保护点】
1.基于语音差分处理的人机交互方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,根据机器人的实际应用需求配置预设时间窗口,将预设时间窗口作为语音数据的采集周期,基于预设时间窗口获取语音样本。
3.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述场景特征集合的获取逻辑:
4.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述背景声纹识别降噪器的构建过程如下:
5.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述降噪
...【技术特征摘要】
1.基于语音差分处理的人机交互方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,根据机器人的实际应用需求配置预设时间窗口,将预设时间窗口作为语音数据的采集周期,基于预设时间窗口获取语音样本。
3.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述场景特征集合的获取逻辑:
4.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述背景声纹识别降噪器的构建过程如下:
5.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述降噪语义数据子序列的获取逻辑;
6.根据权利要求2所述的基于语音差分处理的人机交互方法,其特征在于,所述交互指令...
【专利技术属性】
技术研发人员:刘丰瑜,周超,孙万强,张可欣,周杰,汪文杰,彭亦晨,
申请(专利权)人:上海海洋大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。