System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及终端,尤其涉及一种语音助手的唤醒方法和唤醒装置。
技术介绍
1、随着终端技术的不断发展,越来越多的终端设备具有语音助手功能,该语音助手功能可以支持用户通过语音交互的方式拨打电话、发送短信、打开软件、播放音乐以及设置备忘等语音控制功能。该语音助手功能能够给用户提供非常智能化和人性化的服务,给用户带来极大的方便和更好的服务体验。
2、目前,终端设备支持用户通过语音唤醒方式或者长按终端设备的物理按键的方式唤醒语音助手。但是,语音唤醒方式,会存在无法唤醒的情况,导致唤醒准确率较低。长按终端设备的物理按键的方式,会存在误唤醒的情况,导致用户体验较差。
技术实现思路
1、本申请提供一种语音助手的唤醒方法和唤醒装置,不需要唤醒词,也不需要长按电源键,简化了人机交互的步骤,便于用户可以直接与终端设备通话,还可以提高唤醒准确率,降低误唤醒的概率,有利于提高用户体验。
2、第一方面,提供了一种语音助手的唤醒方法,应用于终端设备,该唤醒方法包括:终端设备检测到终端设备在第一时间内产生抬起事件;终端设备检测到用户在第一时间内处于讲话状态,终端设备与用户的距离小于或等于预设距离;终端设备唤醒语音助手。
3、抬起事件也可以称为抬屏事件,本申请对此不作限定。用户将终端设备抬起时,终端设可以检测到终端设备产生抬起事件。终端设备可以基于终端设备的加速度数据、角速度数据或者重力数据中的至少一个数据,确定终端设备是否产生抬起事件。
4、预设距离可以是一个较小的距
5、终端设备可以采集预设距离内的声音,并基于预设距离内的声音,确定用户是否处于讲话状态。若用户与终端设备的距离小于或等于预设距离,且用户处于讲话状态,则终端设备采集的预设距离内的声音可以包括用户的声音以及用户讲话所产生的气流撞击麦克风而产生的风噪声音。需要说明的是,用户处于讲话状态,此时,用户所讲的不是唤醒词。
6、第一时间可以是一个时刻,也可以是一个较短的时长(例如2ms或者3ms等),本申请实施例对此不作限定。
7、若在第一时间内,终端设备检测到终端设备产生抬起事件,且用户在与终端设备小于或等于预设距离范围内处于讲话状态,则终端设备可以唤醒语音助手。可以理解的是,终端设备产生抬起事件,可以表示用户使用终端设备的概率较大,同时,用户在一个离终端设备较小的距离内讲话,可以表示用户与终端设备进行语音交互的概率较大,此时,终端设可以唤醒语音助手。
8、本申请提供的语音助手的唤醒方法,检测到抬起事件,可以说明用户存在使用需求,且检测到用户距离终端设备较近,并处于讲话状态,则唤醒语音助手,有利于提高唤醒准确率,降低误唤醒的概率,进而提高用户体验,另外,该方法不需要唤醒词,也不需要长按电源键,简化了人机交互的步骤,便于用户可以直接与终端设备通话。
9、结合第一方面,在第一方面的某些实现方式中,终端设备检测到用户在第一时间内处于讲话状态,包括:终端设备将麦克风在第一时间内采集的声音输入至第一模型,得到第一模型的第一输出,第一模型用于识别输入的声音中是否存在用户的声音以及用户讲话所产生的气流撞击麦克风而产生的风噪声音;若第一模型的第一输出大于或等于第一阈值,则终端设备确定用户在第一时间内处于讲话状态。
10、麦克风在第一时间内采集的声音也可以称为语音信号,本申请实施例对此不作限定。第一模型也可以称为气息识别模型或者气息检测模型,本申请对此不作限定。第一模型通过检测用户讲话所产生的气流撞击麦克风而产生的风噪声音可以识别用户以正常音量说话的声音、以小音量说话的声音以及以声带不发生方式说话发出的声音。第一阈值是开发人员经过试验标定的,并预设与终端设备中的。
11、麦克风可以周期性地、实时或者在固定时间采集终端设备所处环境中的声音。麦克风的数量可以是两个或者两个以上。终端设备可以基于两个或者两个以上的麦克风采集的声音,判断用户是否处于讲话状态。
12、终端设备可以通过第一模型识别两个或者两个以上的麦克风采集的声音中是否存在用户的声音以及用户讲话所产生的气流撞击麦克风而产生的风噪声音,若第一模型的第一输出大于或等于第一阈值,则终端设备确定用户在采集声音的时间内处于讲话状态。
13、示例性地,在具体实施例的图2所示的示例中,语音信号b用于表示麦克风在第一时间内采集的声音,气息识别模型用于表示第一模型,输出结果用于表示第一模型的第一输出。
14、本申请提供的语音助手的唤醒方法,通过第一模型检测用户的声音以及用户发出声音的气流的特征以确定用户是否处于讲话状态,可以识别各种不同的声音,可以适用于更多的场景。
15、结合第一方面,在第一方面的某些实现方式中,上述方法还包括:终端设备将麦克风在第二时间内采集的声音输入至第一模型,得到第一模型的第二输出,第二时间处于第一时间之后的第一时长内;若第一模型的第二输出大于或等于第二阈值,则终端设备确定用户在第二时间内处于讲话状态,第二阈值小于第一阈值。
16、第一时长可以是10秒或者12秒等等,本申请对第一时长的具体值不作限定。第二时间处于第一时长内。例如,第一时长为10秒,第二时间可以是第一时间后的第5秒。
17、若麦克风在第二时间内采集到声音,则终端设备可以将该声音输入至第一模型,得到第一模型的第二输出。第二时间处于第一时长内,终端设备将第一模型的第二输出与第二阈值进行比较,若第一模型的第二输出大于或等于第二阈值,则终端设备确定用户在第二时间内处于讲话状态。
18、在第一时长内,终端设备可以将第一阈值降低为第二阈值;在第一时长之后,终端设备可以将第二阈值升高至第二阈值。或者,终端设备预设有第一阈值和第二阈值,在第一时长内,终端设备将第一模型的输出与第二阈值进行比较;在第一时长之后,终端设备将第一模型的输出与第一阈值进行比较。
19、示例性地,在具体实施例中,语音信号c用于表示麦克风在第二时间内采集的声音,语音信号c对应的输出结果用于表示第一模型的第二输出。
20、本申请提供的语音助手的唤醒方法,在唤醒语音助手之后的第一时长内,认为用户讲话的概率较大,可以降低评价标准,将第一模型的第二输出与小于第一阈值的第二阈值进行比较,以使语音助手获取更多的声音,以进行响应,提高语音助手的灵敏度。
21、结合第一方面,在第一方面的某些实现方式中,终端设备检测到终端设备在第一时间内产生抬起事件,包括:终端设备获取终端设备在第一时间内的加速度数据;终端设备将加速度数据输入至第二模型,得到第二模型的输出,第二模型的输出用于指示终端设备在第一时间内产生抬起事件,第二模型用于识别输入的加速度数据对应的事件。
22、终端设备可以通过加速度传感器获取加速度数据。其中,加速度传感器可以是惯性测量单元(inertial measurement un本文档来自技高网...
【技术保护点】
1.一种语音助手的唤醒方法,其特征在于,应用于终端设备,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述终端设备检测到用户在所述第一时间内处于讲话状态,包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述终端设备检测到所述终端设备在第一时间内产生抬起事件,包括:
5.根据权利要求4所述的方法,其特征在于,在所述终端设备将所述加速度数据输入至第二模型之前,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:
8.一种语音助手的唤醒装置,其特征在于,包括:处理器和存储器;
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
10.一种计算机程序产品,其特征在于,包括计算机程序,当所述计算机程序被运行时
...【技术特征摘要】
1.一种语音助手的唤醒方法,其特征在于,应用于终端设备,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述终端设备检测到用户在所述第一时间内处于讲话状态,包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述终端设备检测到所述终端设备在第一时间内产生抬起事件,包括:
5.根据权利要求4所述的方法,其特征在于,在所述终端设备将所述加速度数据输入至第二模型之前,所述方法还包括:
6...
【专利技术属性】
技术研发人员:程权,戴璨,李学敏,高欢,
申请(专利权)人:荣耀终端有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。