用于语音识别文本的方法、设备、客户端装置及电子设备制造方法及图纸

技术编号：18401166 阅读：45 留言：0更新日期：2018-07-08 20:40

公开了一种用于语音识别文本的方法、设备、客户端装置及电子设备。该方法包括：接收来自用户的语音输入；对所述语音输入进行识别，以提供至少两个备选关联词；接收来自用户的指令语音；对所述指令语音进行识别，以得到语音指令，其中，所述语音指令用于确定所述至少两个备选关联词中的目标关联词；以及，基于所述语音指令确定目标关联词，作为所识别的文本。根据本发明专利技术，可以提升语音识别文本的准确性。

Method, device, client device and electronic device for speech recognition text

A method, device, client device and electronic device for speech recognition text are disclosed. The method includes receiving voice input from the user; identifying the speech input to provide at least two alternative words; receiving instruction voice from the user; recognition of the instruction voice to obtain voice instructions, wherein the speech instruction is used to determine the at least two alternative words. The target Related words in the target language; and, based on the voice instructions, determine the target association words as the identified text. According to the invention, the accuracy of the speech recognition text can be improved.

全部详细技术资料下载

【技术实现步骤摘要】
用于语音识别文本的方法、设备、客户端装置及电子设备
本专利技术涉及语音识别
，更具体地，涉及一种用于语音识别文本的方法、设备、客户端装置及电子设备。
技术介绍
随着智能终端的硬件不断升级和系统不断完善，它提供用户交互的手段和方式也越来越多。此外，随着移动互联网使用量的爆发式增长，用户使用手机应用(APP)来解决日常生活需求的场景也越来越多。语音识别技术在手机应用上的应用也越来越广泛。例如，许多搜索引擎、移动浏览器、电商类的APP等都能够支持将用户录入的语音转换为文本以进行搜索的功能。在很多语言中，存在许多发音相同或近似而意思不同的词。尤其在中文中，同音词/近似音词的比例比较高。为了较为准确地从同音词/近似音词集合中识别出用户期望的词，在现有技术中，通常采用的方案是，基于用户完整语段的语义，选择一个最合适的词作为识别出的文本显示给用户。然而，在许多情况下，现有技术的方案不是有效的。例如，当用户仅录入单个词或者录入的语音出现断词时，现有技术的方案无法从同音词/近似音词集合中识别出符合用户期望的词，语音识别的准确率较低。因此，专利技术人认为，有必要对上述现有技术中存在的问题进行改进。
技术实现思路
本专利技术的一个目的是提供一种用于语音识别文本的方法的新技术方案。根据本公开的第一方面，提供了一种用于语音识别文本的方法，包括：接收来自用户的语音输入；对所述语音输入进行识别，以提供至少两个备选关联词；接收来自用户的指令语音；对所述指令语音进行识别，以得到语音指令，其中，所述语音指令用于确定所述至少两个备选关联词中的目标关联词；以及基于所述语音指令确定目标关联词，作...

【技术保护点】
1.一种用于语音识别文本的方法，包括：接收来自用户的语音输入；对所述语音输入进行识别，以提供至少两个备选关联词；接收来自用户的指令语音；对所述指令语音进行识别，以得到语音指令，其中，所述语音指令用于确定所述至少两个备选关联词中的目标关联词；以及基于所述语音指令确定目标关联词，作为所识别的文本。

【技术特征摘要】
1.一种用于语音识别文本的方法，包括：接收来自用户的语音输入；对所述语音输入进行识别，以提供至少两个备选关联词；接收来自用户的指令语音；对所述指令语音进行识别，以得到语音指令，其中，所述语音指令用于确定所述至少两个备选关联词中的目标关联词；以及基于所述语音指令确定目标关联词，作为所识别的文本。2.根据权利要求1所述的方法，其中，对所述语音输入进行识别还包括：对所述语音输入进行识别，以得到该语音输入的语音指纹，其中，所述语音指纹是与所述语音输入相关联的发音特征标识；查询关联词词库以得到与所述语音指纹相关联的至少两个备选关联词；以及向用户显示所述至少两个备选关联词。3.根据权利要求2所述的方法，还包括：基于所确定的目标关联词，调整与所述语音指纹相关联的至少两个备选关联词的位置顺序。4.根据权利要求1所述的方法，其中，所述指令语音是单音节语音。5.根据权利要求4所述的方法，其中，所述语音指令是有限指令集合内的指令。6.根据权利要求5所述的方法，其中，所述备选关联词的数量小于等于10，每个备选关联词与数字1-10中的一个数字对应，以及所述语音指令是数字1-10中的一个。7.根据权利要求4所述的方法，其中，接收来自用户的指令语音还包括：接...

【专利技术属性】
技术研发人员：吴伟勇，
申请(专利权)人：广州市动景计算机科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人