对话轮次结束判断方法、装置、电子设备、介质和车辆制造方法及图纸

技术编号:43863509 阅读:15 留言:0更新日期:2024-12-31 18:51
本公开涉及一种对话轮次结束判断方法、装置、电子设备、介质和车辆;其中,该方法包括:获取待识别语音帧的第一有效语音片段,并识别第一有效语音片段对应的第一文本内容;将第一有效语音片段和第一文本内容输入预设语音识别模型,获取预设语音识别模型输出的第一置信度分数;第一置信度分数用于表示根据第一有效语音片段和第一文本内容预测出的用户未说完一句话的概率;根据第一置信度分数,将预设静音时长调整为目标静音时长;目标静音时长与第一置信度分数成正相关;基于目标静音时长,确定待识别语音帧的对话是否结束。采用本方法能够更灵活地判断用户当前对话是否结束,提升用户的语音交互体验。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及一种对话轮次结束判断方法、装置、电子设备、介质和车辆


技术介绍

1、车辆座舱内的交互以语音交互过程为主,语音交互功能可以通过车机助手实现,用户说完一句话之后,车机助手是否能快速地回复执行,是用户判断交互是否友好的重要参考。参照图1所示,图1为现有技术中车辆座舱内语音交互的流程示意图。具体语音交互的流程如下:首先,用户通过预设的唤醒词唤醒车机助手,使其进入到工作状态,例如,预设的唤醒词可以是:“xx同学”、“小x”等。然后,车机助手通过vad技术检测用户是否有有效语音输入,如果检测到有效语音,则送入语音识别模块进行识别,否则超时退出,例如,唤醒车机助手之后,在预设时间内,用户没有下发具体指令,车机助手会再次询问,“请问您需要什么帮助?”,在几秒内仍没有接收到相应指令,则超时退出。接着,语音识别模块将有效语音转换为识别文本并送入下游语义理解模块,语义理解模块根据识别结果获取用户的意图、动作等信息并发送给下游控制单元,控制单元执行相应的动作。在vad(voice activitydetection,语音活动检测技术)中,对每一个语音帧本文档来自技高网...

【技术保护点】

1.一种对话轮次结束判断方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述预设语音识别模型输出的第一置信度分数的过程,包括:

3.根据权利要求2所述的方法,其特征在于,所述第一声学特征包括以下至少一项:音调特征、拖音特征、发音时长;所述第一文本特征包括语义完整性特征。

4.根据权利要求1所述的方法,其特征在于,获取待识别语音帧的第一有效语音片段,包括:

5.根据权利要求1所述的方法,其特征在于,识别所述第一有效语音片段对应的第一文本内容,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述第一置信...

【技术特征摘要】

1.一种对话轮次结束判断方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述预设语音识别模型输出的第一置信度分数的过程,包括:

3.根据权利要求2所述的方法,其特征在于,所述第一声学特征包括以下至少一项:音调特征、拖音特征、发音时长;所述第一文本特征包括语义完整性特征。

4.根据权利要求1所述的方法,其特征在于,获取待识别语音帧的第一有效语音片段,包括:

5.根据权利要求1所述的方法,其特征在于,识别所述第一有效语音片段对应的第一文本内容,包括:

6.根据权利要求1所...

【专利技术属性】
技术研发人员:李心星张强唐文琦周盼陈伟
申请(专利权)人:北京罗克维尔斯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1