语音控制方法、装置、设备及可读存储介质制造方法及图纸

技术编号：43757798 阅读：18 留言：0更新日期：2024-12-24 16:02

本申请公开了一种语音控制方法、装置、设备及可读存储介质，电子设备获取语音信号，将语音信号转换为待纠错文本。之后，将待纠错文本输入至纠错模型，以使得纠错模型结合待纠错文本中各字符和对应的拼音，对待纠错文本进行纠错以得到目标文本，最后，电子设备根据目标文本生成控制指令以控制终端设备。采用该种方案，通过将拼音的特征引入到纠错过程，缓解传统采用多模型pipeline方法对文本纠错导致的错误级联的问题，提升终端设备的语音交互能力，极大程度上改善用户交互体验，实现提高语音交互质量的目的。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及语音控制，特别涉及一种语音控制方法、装置、设备及可读存储介质。

技术介绍

1、随着人工智能技术的发展，各种自移动设备越来越多地进入人们的生活，比如清洁机器人、空气净化机器人、割草机器人、迎宾机器人等。

2、语音控制技术是一种常见的自移动设备控制方法。语音交互过程中，自移动设备采集用户发出的语音信号，将语音信号转换为文本，再根据文本进行意图识别等从而实现语音控制。为了保证语音交互质量，通常采用多模型pipeline方法对文本纠错，主要包括如下步骤：错误检测、候选召回和候选排序。错误检测的主要目的是识别并定位出文本中错误字词的位置，并将错误向后传递。候选召回是指对错误位置进行候选词的召回。候选排序是指对召回结果进行排序，并返回唯一的正确结果。

3、然而，上述的文本纠错方法中，由于错误逐级传递，上一阶段的错误会对下一阶段产生噪声，导致语音识别出错，甚至导致语音交互失败。

技术实现思路

1、本申请实施例提供一种语音控制方法、装置、设备及可读存储介质，将拼音的...

【技术保护点】

1.一种语音控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述待纠错文本输入纠错模型，使得所述纠错模型结合所述待纠错文本中各字符和对应的拼音，对所述待纠错文本纠错以得到目标文本，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述融合特征向量，对所述待纠错文本纠错以得到目标文本，包括：

4.根据权利要求3所述的方法，其特征在于，所述从所述目标概率集合中确定出概率最大的字符，用概率最大的字符替换所述待纠错文本中位于第一位置的错误字符，从而得到所述目标文本，包括：

5.根据权利要求2所述的方法，其特征在...

【技术特征摘要】

1.一种语音控制方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述融合特征向量，对所述待纠错文本纠错以得到目标文本，包括：

5.根据权利要求2所述的方法，其特征在于，所述根据所述待纠错文本中各字符的第一概率，以及各字符对应的拼音的第二概率，确定所述待纠错文本的融合特征向量，包括：

6.根据权利要求2所述的方法，其特征在于，所述利用所述错模型确定所述待纠错文本中各字符的第一概率，以及各字符对应的拼音的第二概率，包括：

7.根据权利要求1～6任一项...

【专利技术属性】
技术研发人员：张旭，谢韬，秦昌博，
申请(专利权)人：科沃斯家用机器人有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人