基于语音差分处理的人机交互方法、系统、设备及介质技术方案

技术编号:44714897 阅读:21 留言:0更新日期:2025-03-21 17:44
本发明专利技术属于人工智能技术领域,具体公开了基于语音差分处理的人机交互方法、系统、设备及介质,包括提取语音数据序列和场景特征,构建背景噪音数据库,采集用户语音信息,进行声纹识别模型训练,获得降噪器,进行降噪分析,提取降噪语音数据序列的时间间隔,进行对话切分,确定多个语义数据子序列,对多个语义数据子序列进行差分语义分析,确定多个交互指令和交互时间,基于交互指令和时间进行动作执行方案分析,确定机器人动作执行方案,根据动作执行方案对机器人进行交互控制;能够更好地提高机器人对用户语音指令的响应程度,适应用户的个性化需求,从而在家庭环境下进行高效交互应用。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体为基于语音差分处理的人机交互方法、系统、设备及介质


技术介绍

1、人工智能技术飞速发展。技术上,深度学习等先进算法的突破极大提高了机器的学习能力。数据上,海量的网络和物联网数据为ai训练提供了丰富的素材。政策上,各国纷纷支持和投资ai研究,加速了技术成熟。社会对智能化服务的需求不断增长,推动了ai在多个领域的应用。此外,gpu等硬件的进步为复杂的ai计算提供了强大的动力。这些不仅推动了人工智能发展,也带来了一系列如就业变化、隐私保护、伦理道德等问题与挑战。

2、目前,在家庭环境下,用户希望通过语音指令控制机器人向左转,而在电子设备的声音以及其他声源的干扰下,导致传统系统识别出错,常出现错误识别为“向前进”或漏识别问题,进而导致响应故障。当家庭环境下存在多位客人来访,且用户向机器人下发语音指令的同时,多位客人发生声音较大的交流,导致用户的语音与客人交流语音发生重叠,机器人无法对重叠的语音进行准确区分,确定要执行的语音指令,从而无法执行用户下达的语音指令需要完成的动作。

3、此外,在家庭环境中,当用户习惯连本文档来自技高网...

【技术保护点】

1.基于语音差分处理的人机交互方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,根据机器人的实际应用需求配置预设时间窗口,将预设时间窗口作为语音数据的采集周期,基于预设时间窗口获取语音样本。

3.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述场景特征集合的获取逻辑:

4.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述背景声纹识别降噪器的构建过程如下:

5.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述降噪语义数据子序列的获取...

【技术特征摘要】

1.基于语音差分处理的人机交互方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,根据机器人的实际应用需求配置预设时间窗口,将预设时间窗口作为语音数据的采集周期,基于预设时间窗口获取语音样本。

3.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述场景特征集合的获取逻辑:

4.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述背景声纹识别降噪器的构建过程如下:

5.根据权利要求1所述的基于语音差分处理的人机交互方法,其特征在于,所述降噪语义数据子序列的获取逻辑;

6.根据权利要求2所述的基于语音差分处理的人机交互方法,其特征在于,所述交互指令...

【专利技术属性】
技术研发人员:刘丰瑜周超孙万强张可欣周杰汪文杰彭亦晨
申请(专利权)人:上海海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1