【技术实现步骤摘要】
本申请涉及语音交互,尤其涉及一种语音唤醒模型的训练方法、装置、电子设备及存储介质。
技术介绍
1、语音交互技术当前已经广泛应用在各种智能设备中,语音唤醒作为语音交互入口对于用户整个语音交互体验影响非常大。自定义唤醒功能通常在端侧进行部署,事先存放好通用语音唤醒模型,用户在注册阶段输入自己想要的唤醒词文本,生成对应解码网络,生效用户自定义唤醒词,然后在使用过程中根据所设置的唤醒词文本进行语音唤醒。
2、目前,由于用户需要的唤醒词多种多样,因此在进行唤醒时通常使用通用唤醒模型或者定制唤醒模型进行唤醒词检测,其中,定制唤醒模型的唤醒效果要好于通用唤醒模型,但定制周期偏长(通常为2个月)且长于通用唤醒模型,使得在进行自定义定制时都存在各自问题。同时,无论是通用唤醒模型还是定制唤醒唤醒模型,都是针对唤醒词文本的处理,而忽略了用户的实际使用场景,导致唤醒效果较差,影响用户体验。
技术实现思路
1、本申请实施例的目的是提供一种语音唤醒模型的训练方法、装置、电子设备及存储介质,以解决相关技术中
...【技术保护点】
1.一种语音唤醒模型的训练方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述利用生成式大模型对所述唤醒词文本和场景提示进行处理,得到所述场景提示对应的训练数据,包括:
3.如权利要求2所述的方法,其特征在于,所述利用生成式大模型对所述唤醒词文本和所述场景特征进行组合,并进行语音转换将得到的音频数据作为所述场景提示对应的训练数据,包括:
4.如权利要求1所述的方法,其特征在于,所述根据所述测试样本对所述语音唤醒模型进行测试,包括:
5.如权利要求4所述的方法,其特征在于,所述根据得到的比较结果确定所述语
...【技术特征摘要】
1.一种语音唤醒模型的训练方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述利用生成式大模型对所述唤醒词文本和场景提示进行处理,得到所述场景提示对应的训练数据,包括:
3.如权利要求2所述的方法,其特征在于,所述利用生成式大模型对所述唤醒词文本和所述场景特征进行组合,并进行语音转换将得到的音频数据作为所述场景提示对应的训练数据,包括:
4.如权利要求1所述的方法,其特征在于,所述根据所述测试样本对所述语音唤醒模型进行测试,包括:
5.如权利要求4所述的方法,其特征在于,所述根据得到的比较结果确定所述语音唤醒模型是否测试通过,包括:
6.如权利要求2所述的方法...
【专利技术属性】
技术研发人员:常镶石,田垚,单煜翔,
申请(专利权)人:北京欧珀通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。