【技术实现步骤摘要】
语音识别方法、装置、设备和存储介质
[0001]本申请属于语音识别
,具体涉及一种语音识别方法
、
装置
、
设备和存储介质
。
技术介绍
[0002]在高等级生物安全实验室场景下,实验人员可能需要记录大量的实验数据,如样品编号
、
浓度
、
重量等,但由于实验人员需要穿着特殊防护服,繁琐的手动操作会在一定程度上影响实验效率和实验过程的安全性,因此,语音识别系统被广泛应用于高等级生物安全实验室中,以协助实验人员对实验数据进行记录
。
[0003]通常,在使用语音识别系统时,首先用户通过唤醒模块唤醒系统,然后将音频输入到语音识别模块进行识别,之后指令解析模块进行指令词解析,并根据解析获得的指令,对用户后续输入的语音内容进行处理并执行相应操作
。
[0004]但是在实际使用场景中,实验室内可能存在噪音
、
实验人员可能穿着防护服,使得语音音频品质较差,且语音内容通常包含大量专业术语,与日常语言存在较大差异,使得现有的语音识别系统对语音内容的识别不够准确,影响了实验人员工作的顺利进行
。
技术实现思路
[0005]针对上述问题,本申请提供了一种语音识别方法
、
装置
、
设备和存储介质
。
[0006]第一方面,本申请提供一种语音识别方法,所述方法包括:
[0007]在语音处理设备被唤醒后,获取用户输入的引导语音;其中, ...
【技术保护点】
【技术特征摘要】
1.
一种语音识别方法,其特征在于,所述方法包括:在语音处理设备被唤醒后,获取用户输入的引导语音;其中,所述语音处理设备通过用户语音和
/
或用户姿态唤醒;将所述引导语音输入至流式语音识别模型,获取所述流式语音识别模型输出的文本,并根据所述文本获取模型场景指令,所述模型场景指令用于指示处理后续控制语音所需的目标模型;获取所述模型场景指令关联的长音频语音识别模型,其中,所述长音频语音识别模型是根据大语音识别模型和所述模型场景指令匹配的小语音识别模型合并得到的,所述语音处理设备中存储有大语音识别模型和多个不同场景的小语音识别模型;将后续控制语音输入所述长音频语音识别模型,以使得所述长音频识别模型进行相应处理
。2.
根据权利要求1所述的方法,其特征在于,所述根据所述文本获取模型场景指令,包括:对所述文本进行解析,获取关键词;将所述关键词与指令库中的模型场景指令进行匹配,获取与所述关键词匹配的模型场景指令,其中,所述指令库中的模型场景指令是根据小语音识别模型对应的场景预先生成的
。3.
根据权利要求1所述的方法,其特征在于,所述获取所述模型场景指令关联的长音频语音识别模型之前,所述方法还包括:在训练过程中,加载预训练好的大语音识别模型及小语音识别模型;冻结所述大语音识别模型的模型参数,通过模型场景对应的训练数据,训练小语音识别模型的模型参数,得到训练完成的小语音识别模型,并将所述小语音识别模型与模型场景指令进行关联
。4.
根据权利要求1所述的方法,其特征在于,所述小语音识别模型是根据不同的实验室场景的训练数据生成的;所述小语音识别模型用于处理实验数据和
/
或控制实验设备
。5.
根据权利要求4所述的方法,其特征在于,所述将所述后续控制语音输入所述长音频语音识别模型之前,所述方法还包括:获取所述模型场景指令对应的实验室噪音,其中,所述实验室噪音是预先存储的实验室场景下实验设备在安静状态下运行产生的噪音;根据所述实验室噪音,对所述后续控制语音进行降噪处理,得到降噪处理后的后续控制语音
。6.
根据权利要求1所述的方法,其特征在于...
【专利技术属性】
技术研发人员:李文鹏,王琪,刘占杰,李云鹏,李然,
申请(专利权)人:青岛海尔生物医疗股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。