基于语音差分处理的人机交互方法、系统、设备及介质技术方案

技术编号：44714897 阅读：21 留言：0更新日期：2025-03-21 17:44

本发明专利技术属于人工智能技术领域，具体公开了基于语音差分处理的人机交互方法、系统、设备及介质，包括提取语音数据序列和场景特征，构建背景噪音数据库，采集用户语音信息，进行声纹识别模型训练，获得降噪器，进行降噪分析，提取降噪语音数据序列的时间间隔，进行对话切分，确定多个语义数据子序列，对多个语义数据子序列进行差分语义分析，确定多个交互指令和交互时间，基于交互指令和时间进行动作执行方案分析，确定机器人动作执行方案，根据动作执行方案对机器人进行交互控制；能够更好地提高机器人对用户语音指令的响应程度，适应用户的个性化需求，从而在家庭环境下进行高效交互应用。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，具体为基于语音差分处理的人机交互方法、系统、设备及介质。

技术介绍

1、人工智能技术飞速发展。技术上，深度学习等先进算法的突破极大提高了机器的学习能力。数据上，海量的网络和物联网数据为ai训练提供了丰富的素材。政策上，各国纷纷支持和投资ai研究，加速了技术成熟。社会对智能化服务的需求不断增长，推动了ai在多个领域的应用。此外，gpu等硬件的进步为复杂的ai计算提供了强大的动力。这些不仅推动了人工智能发展，也带来了一系列如就业变化、隐私保护、伦理道德等问题与挑战。

2、目前，在家庭环境下，用户希望通过语音指令控制机器人向左转，而在电子设备的声音以及其他声源的干扰下，导致传统系统识别出错，常出现错误识别为“向前进”或漏识别问题，进而导致响应故障。当家庭环境下存在多位客人来访，且用户向机器人下发语音指令的同时，多位客人发生声音较大的交流，导致用户的语音与客人交流语音发生重叠，机器人无法对重叠的语音进行准确区分，确定要执行的语音指令，从而无法执行用户下达的语音指令需要完成的动作。

3、此外，在家庭...

【技术保护点】

1.基于语音差分处理的人机交互方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于语音差分处理的人机交互方法，其特征在于，根据机器人的实际应用需求配置预设时间窗口，将预设时间窗口作为语音数据的采集周期，基于预设时间窗口获取语音样本。

3.根据权利要求1所述的基于语音差分处理的人机交互方法，其特征在于，所述场景特征集合的获取逻辑：

4.根据权利要求1所述的基于语音差分处理的人机交互方法，其特征在于，所述背景声纹识别降噪器的构建过程如下：

5.根据权利要求1所述的基于语音差分处理的人机交互方法，其特征在于，所述降噪语义数据子序列的获取...

【技术特征摘要】

1.基于语音差分处理的人机交互方法，其特征在于：包括以下步骤：

3.根据权利要求1所述的基于语音差分处理的人机交互方法，其特征在于，所述场景特征集合的获取逻辑：

4.根据权利要求1所述的基于语音差分处理的人机交互方法，其特征在于，所述背景声纹识别降噪器的构建过程如下：

5.根据权利要求1所述的基于语音差分处理的人机交互方法，其特征在于，所述降噪语义数据子序列的获取逻辑；

6.根据权利要求2所述的基于语音差分处理的人机交互方法，其特征在于，所述交互指令...

【专利技术属性】
技术研发人员：刘丰瑜，周超，孙万强，张可欣，周杰，汪文杰，彭亦晨，
申请(专利权)人：上海海洋大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人