语音识别的方法、装置、设备和计算机可读介质制造方法及图纸

技术编号：29092930 阅读：38 留言：0更新日期：2021-06-30 10:01

本发明专利技术公开了语音识别的方法、装置、设备和计算机可读介质，涉及人工智能技术领域。该方法的一具体实施方式包括：将用户语音输入至声学模型中；所述声学模型输出用户音素至语言模型中，所述语言模型输出用户文字序列；通过词典替换所述用户文字序列中的文字，得到多个语音近似词；输出所述多个语音近似词，并基于接收到的指令和所述多个语音近似词，确定所述用户语音的输出文字序列。该实施方式能够提高语音识别的准确率。语音识别的准确率。语音识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别的方法、装置、设备和计算机可读介质

[0001]本专利技术涉及人工智能
，尤其涉及一种语音识别的方法、装置、设备和计算机可读介质。

技术介绍

[0002]通过语音识别输出文本，已成为一种逐渐流行的人机交互方式。但由于目前语音识别系统缺少说话人的语言背景或上下文环境，在识别多音词组时容易产生错误。如“龙信“识别为”农信“，进而会降低总体识别准确率影响功能正常使用。
[0003]在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：语音识别的准确率较低。

技术实现思路

[0004]有鉴于此，本专利技术实施例提供一种语音识别的方法、装置、设备和计算机可读介质，能够提高语音识别的准确率。
[0005]为实现上述目的，根据本专利技术实施例的一个方面，提供了一种语音识别的方法，包括：
[0006]将用户语音输入至声学模型中；
[0007]所述声学模型输出用户音素至语言模型中，所述语言模型输出用户文字序列；
[0008]通过词典替换所述用户文字序列中的文字，得到多个语音近似词；
[0009]输出所述多个语音近似词，并基于接收到的指令和所述多个语音近似词，确定所述用户语音的输出文字序列。
[0010]所述将用户语音输入至声学模型中之前，还包括：
[0011]对用户原始语音进行滤波和分帧处理，得到所述用户语音。
[0012]所述用户原始语音是通过移动终端或语音采集设备获取的。
[0013]所述将用户语音输入至声学模...

【技术保护点】

【技术特征摘要】
1.一种语音识别的方法，其特征在于，包括：将用户语音输入至声学模型中；所述声学模型输出用户音素至语言模型中，所述语言模型输出用户文字序列；通过词典替换所述用户文字序列中的文字，得到多个语音近似词；输出所述多个语音近似词，并基于接收到的指令和所述多个语音近似词，确定所述用户语音的输出文字序列。2.根据权利要求1所述语音识别的方法，其特征在于，所述将用户语音输入至声学模型中之前，还包括：对用户原始语音进行滤波和分帧处理，得到所述用户语音。3.根据权利要求2所述语音识别的方法，其特征在于，所述用户原始语音是通过移动终端或语音采集设备获取的。4.根据权利要求1所述语音识别的方法，其特征在于，所述将用户语音输入至声学模型中，包括：将预设时间段内的用户语音输入至声学模型中。5.根据权利要求4所述语音识别的方法，其特征在于，所述预设时间段是由用户预先设置的。6.根据权利要求1所述语音识别的方法，其特征在于，所述通过词典替换所述用户文字序列中的文字，得到多个语音近似词，包括：通过词典替换所述用户文字序列中的同音字和/或近音字，得到多个语音近似词。7.根据权利要求6所述语音识别的方法，其特征在于，所述通过词典替换所述用户文字序列中的同音字和/或近音字，得到多个语音近似词，包括：通过词典替换所述用户文字序列中的同音字和/或近音字；在替换后的用户文字序列中词语中，剔除非常用词语，得到多个语音近似词。8.根据权利要求6所述语音识别的方法，其特征在于，所述在替换后的用户文字序列中词语中，剔除非常用词语，得到多个语音近似词，包括：遍历替换后的用户文字序列中词语，采用常用词语词典剔除非常用词语，得到多个语音近似词。9.根据权利要求1所述语音识别的方法，其特征在于，所述输出所述多个语音近似词，并基于接收到的指令和所述多个语音近似词，确定所述用户语音的输出文字序列，包括：输出所述多个语音近似词，并接收指令，所述指令包括所述多个语音近似词中的一个或多个语音近似词；基于所述多个语音近似词中的一个或多个语音近似词和所述用户文字序列，确定所述用户语音的输出文字序列。10.根据权利要求9所述语音识别的方法，其特征在于，所述输出所述多个语音近似词，包括：按照所述语音近似词的使用频率，输出所述多个语音近似词。11.根据权利要求9所述语音识别的方法，其特征在于，...

【专利技术属性】
技术研发人员：周永吉，郭敏鸿，范会善，王炼，马亮亮，章铃娜，姜京京，
申请(专利权)人：建信金融科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人