一种人机交互判定方法及装置制造方法及图纸

技术编号：41448540 阅读：22 留言：0更新日期：2024-05-28 20:38

本申请公开了一种人机交互判定方法及装置，涉及车载智能对话技术领域，主要目的在于提高对交互环境是人人交互还是人机交互的识别准确性。本申请主要的技术方案为：获取目标音频对的音频特征，所述目标音频对包括两段不同且均为指定长度的特定音频；将所述音频特征分别输入多个对应不同识别维度的子任务模型中，得到每个所述子任务模型对应的维度特征结果；将多个所述维度特征结果堆叠并输入至主任务模型中，得到所述主任务模型对应的综合判定结果，所述综合判定结果用于表征所述目标音频对的交互场景是否为人机交互。本申请用于人机交互的判定。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及车载智能对话，尤其涉及一种人机交互判定方法及装置。

技术介绍

1、随着现代汽车智能化水平不断提升，车载语音交互系统已经成为提升驾驶安全与用户体验的重要组成部分。而实现准确区分用户是在进行人人交互还是与车机进行人机交互一直是业界亟待解决的关键技术难题。

2、目前，车载语音交互系统对于区分交互场景是人人交互还是人机交互主要依赖自动语音识别（automatic speech recognition, asr）技术和自然语言处理（naturallanguageprocessing, nlp）技术相结合的方式，即通过将音频信息转换为文本信息，再基于文本信息的语义和上下文关系分析来判断交互场景。但asr技术容易因噪声干扰、口音差异等因素导致转换得到的文本信息出现误差，且转换本文信息会造成音频中存在的情绪、语气等非文本信息丢失，这样会影响后续nlp技术的判断，从而降低对交互场景的识别精确性。

技术实现思路

1、鉴于上述问题，本申请提供一种人机交互判定方法及装置，主要目的是提高对交互...

【技术保护点】

1.一种人机交互判定方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，获取目标音频对的音频特征，包括：

3.根据权利要求2所述的方法，其特征在于，在获取目标音频对的音频特征之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，将每个所述维度特征结果堆叠并输入至主任务模型中，得到所述主任务模型对应的综合判定结果，包括：

5.根据权利要求4所述的方法，其特征在于，在将每个所述维度特征结果堆叠并输入至主任务模型中，得到所述主任务模型对应的综合判定结果之前，所述方法还包括：

6.根据权利要求5所述的...

【技术特征摘要】

1.一种人机交互判定方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，获取目标音频对的音频特征，包括：

3.根据权利要求2所述的方法，其特征在于，在获取目标音频对的音频特征之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，将每个所述维度特征结果堆叠并输入至主任务模型中，得到所述主任务模型对应的综合判定结果，包括：

<...

【专利技术属性】
技术研发人员：陆晨昱，
申请(专利权)人：合众新能源汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人