语音识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号：25311584 阅读：24 留言：0更新日期：2020-08-18 22:29

本申请公开了一种语音识别方法、装置、设备及可读存储介质，涉及人工智能技术领域。具体实现方案为：电子设备识别语音信号得到第一文本，若数据库中存在该第一文本对应的第一拼音序列，则将第一拼音序列对应的正确文本作为语音识别结果；否则，对第一拼音序列进行模糊匹配得到多个第二拼音序列和与第二拼音序列对应的第二文本，并从多个第二文本中选择出语音识别结果。该过程中，电子设备通过模糊匹配等自动纠正误识别得到正确的语音识别结果，提升语音识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备及可读存储介质
本申请实施例涉及人工智能(ArtificialIntelligence，AI)，尤其涉及一种语音识别方法、装置、设备及可读存储介质。
技术介绍
随着人工智能的飞速发展，语音识别技术被广泛的应用到手机、车载终端等产品上。语音识别技术本质上是将用户发出的语音转换为文字，基于文字执行相应的指令的过程。由于个人发音差异以及地域口语等问题，利用语音识别技术识别语音时很容易出现误识别的情况。例如，将用户发出的“右座位加热”语音信号识别为“有座位加热”的文本，一个误识别称之为一个坏例。为避免误识别，常见的做法是创建一个纠正文件，每发现一个新的坏例，则在纠正文件中增加该坏例和该坏例的正确结果的对应关系。该纠正文件被打包在具有语音识别功能的应用程序的安装包里，用户下载安装包并安装。之后，用户使用终端设备上安装的该应用的语音识别功能时，若发生误识别，则终端设备从纠正文件中查找出正确结果从而提高语音识别的准确性。然而，上述通过人力创建纠正文件的方式无法覆盖所有的坏例，导致一些坏例很难被发现，...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：/n通过识别获取的语音信号，得到第一文本；/n利用所述第一文本对应的第一拼音序列，进行数据库的检索；/n响应于在所述数据库中未搜索到所述第一拼音序列，根据所述第一拼音序列进行模糊搜索，所述模糊搜索用于查找具有所述第一拼音序列中至少一个拼音的第二拼音序列和与所述第二拼音序列对应的第二文本；/n选取所述模糊搜索得到的至少一个第二文本，作为所述语音信号的语音识别结果。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
通过识别获取的语音信号，得到第一文本；
利用所述第一文本对应的第一拼音序列，进行数据库的检索；
响应于在所述数据库中未搜索到所述第一拼音序列，根据所述第一拼音序列进行模糊搜索，所述模糊搜索用于查找具有所述第一拼音序列中至少一个拼音的第二拼音序列和与所述第二拼音序列对应的第二文本；
选取所述模糊搜索得到的至少一个第二文本，作为所述语音信号的语音识别结果。

2.根据权利要求1所述的方法，其特征在于，所述选取所述模糊搜索得到的至少一个第二文本，作为所述语音信号的语音识别结果，包括：
确定所述至少一个第二文本中各第二文本对应的第二拼音序列和所述第一拼音序列的相似度，以得到多个相似度；
根据所述多个相似度中的最大相似度，从所述至少一个第二文本中确定出所述语音信号的语音识别结果。

3.根据权利要求2所述的方法，其特征在于，所述根据所述多个相似度中的最大相似度，从所述至少一个第二文本中确定出所述语音信号的语音识别结果，包括：
若所述最大相似度大于或等于预设阈值，则确定所述最大相似度对应的第二文本为所述语音信号的语音识别结果；或者，
若所述最大相似度小于所述预设阈值，则确定所述第一文本为所述语音信号的语音识别结果。

4.根据权利要求3所述的方法，其特征在于，所述若所述最大相似度大于或等于预设阈值，则确定所述最大相似度对应的第二文本作为所述语音信号的语音识别结果之后，还包括：
将所述第一文本添加至所述最大相似度对应的第二文本的泛化表中，所述泛化表用于存储所述最大相似度对应的第二文本的泛化文本，所述泛化文本与所述第二文本具有相同的意图。

5.根据权利要求4所述的方法，其特征在于，还包括：
向服务器发送第一数据流，所述第一数据流携带所述最大相似度对应的第二文本、所述第一文本以及所述第一拼音序列的对应关系。

6.根据权利要求1所述的方法，其特征在于，还包括：
识别用户输入的第二数据流，所述第二数据流用于指示所述第二文本与所述第二拼音序列的对应关系，以及所述第二文本的泛化文本；
向服务器发送所述第二数据流。

7.根据权利要求1-6任一项所述的方法，其特征在于，所述利用所述第一文本对应的第一拼音序列，进行数据库的检索之后，所述方法还包括：
若从所述数据库中未搜索到所述第一拼音序列，则确定所述语音信号的识别结果为所述第一拼音序列对应的第三文本。

8.根据权利要求1-6任一项所述的方法，其特征在于，所述响应于在所述数据库中未搜索到所述第一拼音序列，根据所述第一拼音序列进行模糊搜索之前，还包括：
确定所述数据库中不存在所述第一文本。

9.一种语音识别装置，其特征在于，包括：
识别模块，用于通过识别获取的语音信号，得到第一文本；
检索模块，用于利用所述第一文本对应的第一拼音序列，进行数据库的检索；
匹配模块，用于响应于在所述数据库中未搜索到所述第一拼音序列，根据所述第一拼音序列进行模糊搜索，所述模糊搜索用于查找具有所述第一拼音序列中至少一个拼音的第二拼音序列和与所述第二拼音序列对应的第二文本；
确定模块，用于选取所述模糊搜索得...

【专利技术属性】
技术研发人员：周毅，殷切，张龙，陈真，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人