语音控制方法、装置、设备及可读存储介质制造方法及图纸

技术编号:43757798 阅读:18 留言:0更新日期:2024-12-24 16:02
本申请公开了一种语音控制方法、装置、设备及可读存储介质,电子设备获取语音信号,将语音信号转换为待纠错文本。之后,将待纠错文本输入至纠错模型,以使得纠错模型结合待纠错文本中各字符和对应的拼音,对待纠错文本进行纠错以得到目标文本,最后,电子设备根据目标文本生成控制指令以控制终端设备。采用该种方案,通过将拼音的特征引入到纠错过程,缓解传统采用多模型pipeline方法对文本纠错导致的错误级联的问题,提升终端设备的语音交互能力,极大程度上改善用户交互体验,实现提高语音交互质量的目的。

【技术实现步骤摘要】

本申请实施例涉及语音控制,特别涉及一种语音控制方法、装置、设备及可读存储介质


技术介绍

1、随着人工智能技术的发展,各种自移动设备越来越多地进入人们的生活,比如清洁机器人、空气净化机器人、割草机器人、迎宾机器人等。

2、语音控制技术是一种常见的自移动设备控制方法。语音交互过程中,自移动设备采集用户发出的语音信号,将语音信号转换为文本,再根据文本进行意图识别等从而实现语音控制。为了保证语音交互质量,通常采用多模型pipeline方法对文本纠错,主要包括如下步骤:错误检测、候选召回和候选排序。错误检测的主要目的是识别并定位出文本中错误字词的位置,并将错误向后传递。候选召回是指对错误位置进行候选词的召回。候选排序是指对召回结果进行排序,并返回唯一的正确结果。

3、然而,上述的文本纠错方法中,由于错误逐级传递,上一阶段的错误会对下一阶段产生噪声,导致语音识别出错,甚至导致语音交互失败。


技术实现思路

1、本申请实施例提供一种语音控制方法、装置、设备及可读存储介质,将拼音的特征引入到纠错过程,本文档来自技高网...

【技术保护点】

1.一种语音控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述待纠错文本输入纠错模型,使得所述纠错模型结合所述待纠错文本中各字符和对应的拼音,对所述待纠错文本纠错以得到目标文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述融合特征向量,对所述待纠错文本纠错以得到目标文本,包括:

4.根据权利要求3所述的方法,其特征在于,所述从所述目标概率集合中确定出概率最大的字符,用概率最大的字符替换所述待纠错文本中位于第一位置的错误字符,从而得到所述目标文本,包括:

5.根据权利要求2所述的方法,其特征在...

【技术特征摘要】

1.一种语音控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述待纠错文本输入纠错模型,使得所述纠错模型结合所述待纠错文本中各字符和对应的拼音,对所述待纠错文本纠错以得到目标文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述融合特征向量,对所述待纠错文本纠错以得到目标文本,包括:

4.根据权利要求3所述的方法,其特征在于,所述从所述目标概率集合中确定出概率最大的字符,用概率最大的字符替换所述待纠错文本中位于第一位置的错误字符,从而得到所述目标文本,包括:

5.根据权利要求2所述的方法,其特征在于,所述根据所述待纠错文本中各字符的第一概率,以及各字符对应的拼音的第二概率,确定所述待纠错文本的融合特征向量,包括:

6.根据权利要求2所述的方法,其特征在于,所述利用所述错模型确定所述待纠错文本中各字符的第一概率,以及各字符对应的拼音的第二概率,包括:

7.根据权利要求1~6任一项...

【专利技术属性】
技术研发人员:张旭谢韬秦昌博
申请(专利权)人:科沃斯家用机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1