语音唤醒方法及装置制造方法及图纸

技术编号:18765479 阅读:20 留言:0更新日期:2018-08-25 11:26
本发明专利技术公开了一种语音唤醒方法及装置,属于语音处理技术领域。所述方法包括:采集当前时刻车内的语音信号;计算从所述语音信号中提取的唤醒词的声学得分,所述声学得分用于指示所述唤醒词的真实性;根据车内的噪声确定语音唤醒阈值,所述语音唤醒阈值的大小与所述噪声的大小呈负相关关系;当所述声学得分大于所述语音唤醒阈值时,执行语音唤醒操作。本发明专利技术不仅可以提高语音唤醒的成功率;还可以根据车内的噪声确定语音唤醒阈值,使得噪声越大,语音唤醒阈值越低,从而提高语音唤醒的成功率;噪声越小,使得语音唤醒阈值越高,从而降低语音唤醒的误唤醒率;还可以减少车机的成本。

【技术实现步骤摘要】
语音唤醒方法及装置
本专利技术涉及语音处理
,特别涉及一种语音唤醒方法及装置。
技术介绍
语音唤醒是指用户通过说出唤醒词来唤醒电子设备,使电子设备进入到等待语音指令的状态或使电子设备直接执行预定语音指令。语音唤醒通常应用于车机中,这样,司机不需要手动操作即可控制车机。由于高速行车时车内的噪声较大,因此,车机需要对用户说出的语音信号进行降噪处理。具体地,可以在麦克风上增加硬件降噪模块,通过该硬件降噪模块对麦克风采集到的语音信号进行降噪处理,再利用降噪处理后的语音信号进行语音唤醒。当噪声较大时,即使通过硬件降噪模块对语音信号进行了降噪处理,得到的语音信号中的噪声仍然较大,影响语音唤醒的成功率。另外,增加硬件降噪模块会增加车机的成本,且增加硬件降噪模块后,还需要对麦克风的电路进行调整,进一步增加了车机的成本。
技术实现思路
为了解决经硬件降噪模块处理后的语音信号中的噪声较大,影响语音唤醒的准确率以及增加了车机的成本的问题,本专利技术实施例提供了一种语音唤醒方法及装置。所述技术方案如下:第一方面,提供了一种语音唤醒方法,用于位于车内的电子设备中,所述方法包括:采集当前时刻车内的语音信号;计算从所述语音信号中提取的唤醒词的声学得分,所述声学得分用于指示所述唤醒词的真实性;根据车内的噪声确定语音唤醒阈值,所述语音唤醒阈值的大小与所述噪声的大小呈负相关关系;当所述声学得分大于所述语音唤醒阈值时,执行语音唤醒操作。第二方面,提供了一种语音唤醒装置,用于位于车内的电子设备中,所述装置包括:采集模块,用于采集当前时刻车内的语音信号;计算模块,用于计算从所述采集模块得到的所述语音信号中提取的唤醒词的声学得分,所述声学得分用于指示所述唤醒词的真实性;第一确定模块,用于根据车内的噪声确定语音唤醒阈值,所述语音唤醒阈值的大小与所述噪声的大小呈负相关关系;执行模块,用于当所述计算模块得到的所述声学得分大于所述第一确定模块得到的所述语音唤醒阈值时,执行语音唤醒操作。电子设备计算唤醒词的声学得分,并将声学得分与语音唤醒阈值进行比较,根据比较结果确定是否执行语音操作,这样,即使语音信号中的噪声较大,只要该语音信号中的唤醒词的声学得分大于语音唤醒阈值,即可执行语音唤醒操作,从而提高语音唤醒的成功率。电子设备根据车内的噪声确定语音唤醒阈值,使得噪声越大,语音唤醒阈值越低,从而提高语音唤醒的成功率;噪声越小,使得语音唤醒阈值越高,从而降低语音唤醒的误唤醒率。当电子设备是车机时,由于不需要在车机中增加硬件降噪模块,因此,可以减少车机的成本;另外,由于不需要在车机中增加硬件降噪模块,因此,也就不需要对麦克风的电路进行调整,从而可以进一步减少车机的成本。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据部分示例性实施例示出的一种语音唤醒装置的结构示意图;图2是本专利技术一个实施例提供的语音唤醒方法的方法流程图;图3是本专利技术另一实施例提供的语音唤醒方法的方法流程图;图4是本专利技术一个实施例提供的语音唤醒装置的结构框图;图5是本专利技术再一实施例提供的语音唤醒装置的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。下面对本专利技术实施例涉及到的名词进行解释。位于车内的电子设备:本实施例中涉及的位于车内的电子设备包括安装在车内的电子设备和位于车内的移动终端。其中,安装在车内的电子设备是中控台或车机或智能后视镜等等,本实施例不作限定。位于车内的移动终端可以是手机或平板电脑或可穿戴设备等等,本实施例不作限定。中控台:车辆的操作控制台。当电子设备是中控台时,由中控台中安装的操作系统执行语音唤醒方法。车机:安装在车内的车载信息娱乐产品的简称。车机能够实现人与车、车与车的通信。智能后视镜:具有独立的操作系统和独立的运行空间,可以由用户自行安装游戏、导航等第三方服务商提供的程序,提供行车记录、GPS(GlobalPositioningSystem,全球定位系统)定位、电子测速提醒、倒车可视、实时在线影音娱乐等功能的智能化后视镜。智能后视镜还可以通过WIFI(WirelessFidelity,无线保真)或者移动网络接入无线网络。唤醒词:用于唤醒电子设备执行语音唤醒操作的字符串。比如,唤醒词是“Hello,小飞”等。语音指令:语音控制电子设备执行预定操作的指令。比如,语音指令可以是“导航回家”、“播放音乐”等。声学得分:用于指示唤醒词的真实性。声学得分与唤醒词的真实性呈正相关关系,即,声学得分越高,唤醒词的真实性越高;声学得分越低,唤醒词的真实性越低。唤醒词的真实性:唤醒词用于唤醒电子设备执行语音唤醒操作的概率。比如,唤醒词为“小飞”,若用户说出的语句为“小飞今天过来吃饭”,该语句中包含朋友的名字“小飞”,此时“小飞”这个唤醒词并不是用于唤醒电子设备执行语音唤醒操作的,唤醒词的真实性较低;若用户说出的语句为“小飞”,该语句中“小飞”这个唤醒词用于唤醒电子设备执行语音唤醒操作的,唤醒词的真实性较高。语音唤醒阈值:用于供电子设备判定是否根据唤醒词执行语音唤醒操作。当唤醒词的声学得分大于语音唤醒阈值时,执行语音唤醒操作;当唤醒词的声学得分小于语音唤醒阈值时,不执行语音唤醒操作。车内的噪声:包括发动机噪声、路噪、胎噪、风噪、共鸣噪等等。发动机噪声是发动机转动所产生的噪声;路噪包括车辆行驶的时候风切入所产生的噪声、行驶带动底盘振动所产生的噪声、路上沙石冲击底盘所产生的噪声;胎噪是轮胎与路面摩擦所产生的噪声;风噪是车辆行驶过程中迎面而来的风的压力超过车门的密封阻力进入车内所产生的噪声;共鸣噪是车内的噪声折射和重叠形成共鸣所产生的噪声。请参考图1,其示出了本专利技术实施例提供的一种语音唤醒装置的结构示意图。该语音唤醒装置包括麦克风110、语音识别模块120和语音唤醒阈值动态仲裁模块130,麦克风110和语音唤醒阈值动态仲裁模块130分别与语音识别模块120相连,图1中以实线表示;麦克风110和语音唤醒阈值动态仲裁模块130之间可以相连,也可以不相连,图1中以虚线表示。下面对位于车内的语音唤醒装置中各模块的功能进行介绍。麦克风110处于工作状态时,持续采集车内的语音信号,并每隔预定时间段将该时间段内采集的语音信号发送给语音识别模块120。其中,预定时间段的时长通常设置得较短,比如,预定时间段的时长为20-30ms。语音唤醒阈值动态仲裁模块130用于获取车内的噪声,根据该噪声动态确定语音唤醒阈值,并将语音唤醒阈值发送给语音识别模块120。语音识别模块120用于识别出语音信号中的唤醒词,并计算唤醒词的声学得分,将声学得分与语音唤醒阈值进行比较,根据比较结果确定是否执行语音唤醒操作。相关技术中,语音唤醒阈值是固定值,且语音唤醒阈值越低,唤醒成功率越高,误唤醒率越高;语音唤醒阈值越高,唤醒成功率越低,误唤醒率越低。然而车内的噪声是动态变化的,如果车内的噪声较小,说明用户说出的语句较为清晰,此时可以将语音唤醒阈值设置得较大,以降低误唤醒率,若本文档来自技高网...

【技术保护点】
1.一种语音唤醒方法,用于位于车内的电子设备中,其特征在于,所述方法包括:采集当前时刻车内的语音信号;计算从所述语音信号中提取的唤醒词的声学得分,所述声学得分用于指示所述唤醒词的真实性;根据车内的噪声确定语音唤醒阈值,所述语音唤醒阈值的大小与所述噪声的大小呈负相关关系;当所述声学得分大于所述语音唤醒阈值时,执行语音唤醒操作。

【技术特征摘要】
1.一种语音唤醒方法,用于位于车内的电子设备中,其特征在于,所述方法包括:采集当前时刻车内的语音信号;计算从所述语音信号中提取的唤醒词的声学得分,所述声学得分用于指示所述唤醒词的真实性;根据车内的噪声确定语音唤醒阈值,所述语音唤醒阈值的大小与所述噪声的大小呈负相关关系;当所述声学得分大于所述语音唤醒阈值时,执行语音唤醒操作。2.根据权利要求1所述的方法,其特征在于,在所述根据车内的噪声确定语音唤醒阈值之前,还包括:根据所述语音信号的平均分贝值确定车内的噪声;或者,获取在所述语音信号之前采集到的至少一段语音信号,根据所述至少一段语音信号的平均分贝值确定车内的噪声;或者,获取在所述语音信号之前采集到的至少一段语音信号,根据当前时刻采集的所述语音信号和所述至少一段语音信号的平均分贝值确定车内的噪声。3.根据权利要求1所述的方法,其特征在于,在所述根据车内的噪声确定语音唤醒阈值之前,还包括:根据当前时刻的车速确定车内的噪声,所述噪声的大小与所述车速的大小呈正相关关系。4.根据权利要求1至3任一所述的方法,其特征在于,所述根据车内的噪声确定语音唤醒阈值,包括:获取预设的噪声区间和语音唤醒阈值区间,所述噪声区间中的每个数值对应于所述语音唤醒阈值区间中的一个数值;根据所述噪声在所述噪声区间中的数值,从所述语音唤醒阈值区间中选择一个对应的数值作为所述语音唤醒阈值。5.根据权利要求1所述的方法,其特征在于,所述位于车内的电子设备是安装在车内的电子设备或位于车内的移动终端,所述安装在车内的电子设备是中控台或车机或智能后视镜。6.一种语音唤醒装置,用于位于车内的电子设备中,其特征在于,所述装置包括:采集模块,用于采集当前时刻车内的语音信号;计算模块,用于计算从所述采集模块得到的所述语音信...

【专利技术属性】
技术研发人员:向乾彪陈梦麟
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1