语音识别的处理方法、装置、电子设备及可读介质制造方法及图纸

技术编号:37887622 阅读:24 留言:0更新日期:2023-06-18 11:52
本发明专利技术实施例提供了一种语音识别的处理方法、装置、电子设备及可读介质,所述方法包括:在语音交互场景中,终端可以获取用户输入的语音信号,并确定语音信号对应的目标语音场景以及该语音信号对应的语速信息,接着根据目标语音场景和/或目标语速信息,调节预设超时阈值,获得针对语音信号的目标超时阈值,并采集语音信号对应的VAD超时时间,然后可以根据目标超时阈值对语音信号进行识别,若VAD超时时间大于或等于目标超时阈值,则输出针对语音信号的结束信号,并生成与语音信号对应的识别结果。结果。结果。

【技术实现步骤摘要】
语音识别的处理方法、装置、电子设备及可读介质


[0001]本专利技术涉及语音识别的处理
,特别是涉及一种语音识别的处理方法、一种语音识别的处理装置、一种电子设备以及一种计算机可读介质。

技术介绍

[0002]随着科技的进步,人们的工作、生活几乎每天都应用到计算机以及网络,为了更便捷、高效地为工作、生活服务,语音识别在各个领域里的应用日益广泛,比如,人与移动终端的语音识别,人与车载终端的语音识别,人与人之间沟通交流时以语音识别的方式记录两者的对话内容,亦或是随时随地地以语音的方式记录自己的所思所想等等,这一识别方式已逐渐成为语音应用发展的趋势。语音识别的过程可以包括:语音信号采集、语音信号的特征参数提取、声学模型与模式匹配、语言模型与语言处理。
[0003]其中,在第一步骤中的语音信号采集时,首先要对用户输入的语音信号进行判断,准确找出语音信号的起始点和终止点,从而知晓用户的这句话是否已说完,这就应用到端点检测技术(VoiceActivityDetection,VAD),VAD技术作为语音识别系统与处理阶段遇到的第一个关键技术,其准本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别的处理方法,其特征在于,包括:获取用户输入的语音信号,并确定所述语音信号对应的目标语音场景以及所述语音信号对应的语速信息;根据所述目标语音场景和/或所述目标语速信息,调节预设超时阈值,获得针对所述语音信号的目标超时阈值;采集所述语音信号对应的VAD超时时间;若所述VAD超时时间大于或等于所述目标超时阈值,则输出针对所述语音信号的结束信号,并生成与所述语音信号对应的识别结果。2.根据权利要求1所述的方法,其特征在于,所述确定所述语音信号对应的目标语音场景,包括:将所述语音信号转换为文本信息,并将与所述文本信息匹配成功的预设语音场景作为所述语音信号对应的目标语音场景;其中,所述预设语音场景至少包括地图导航场景、音乐控制场景、语音对话场景、天气查询场景、车载游戏场景、车载硬件控制场景中的一种。3.根据权利要求2所述的方法,其特征在于,所述确定所述语音信号对应的语速信息,包括:获取所述文本信息中文字的数量;根据所述文字的数量与所述预设语速信息,计算所述语音信号对应的语速信息。4.根据权利要求1所述的方法,其特征在于,所述根据所述目标语音场景,调节预设超时阈值,获得针对所述语音信号的目标超时阈值,包括:将预设超时阈值切换为所述目标语音场景对应的第一目标超时阈值。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标语速场景,调节预设超时阈值,获得针对所述语音信号的目标超时阈值,包括:采用预设语速信息与所述目标语速信息,计算针对所述语音信号的目标超时阈值;将预设超时阈值切换为所述目标超时阈值。6.根据权利要求5所述的方法,其特征在于,所述根据所述目标语音场景,调节预设超时阈值,获得针对所述语音信号的目标超时阈值,包括:获取所述目标语音场景对应的场景阈值;将所述目标超时阈值与所述场景阈值之间的和值作为所述目标语音场景的超时阈值。7.根据权利要求1所述的方法,其...

【专利技术属性】
技术研发人员:周力为
申请(专利权)人:博泰车联网南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1