语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：37110009 阅读：38 留言：0更新日期：2023-04-01 05:07

本发明专利技术公开了一种语音识别方法、装置、设备及存储介质。该方法包括：针对待识别语音，获取对应的初始语句文本，并对所述初始语句文本进行第一分词处理，得到第一分词结果；基于预设的同义词词典对所述第一分词结果进行分词匹配，并根据匹配情况对所述初始语句文本进行修正，得到修正语句文本；基于预设的用户词典和分词器对所述修正语句文本进行语句回测；根据语句回测结果确定对应的语音识别结果。本发明专利技术结合同义词词典进行词条匹配，增加对用户口语化表达的泛化匹配能力，同时利用用户词典和分词器对修正语句进行回测验证，确保修正结果的正确性，从而提高了语音识别的准确性。从而提高了语音识别的准确性。从而提高了语音识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种语音识别方法、装置、设备及存储介质。

技术介绍

[0002]ASR(Automatic Speech Recognition)，即自动语音识别，是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列等。
[0003]近年来，ASR在许多行业中均有应用。例如，现有的智能问答系统平台通常会用到ASR进行语音转文本，以实现智能客服。但是在实践中，由于客服系统上线后，用户自定义的词汇在原有语料中未曾出现过，尤其是新增业务名称或产品名称，这就导致ASR识别的准确性较差，并进一步导致后续的意图识别、文本匹配的效果也变差，从而影响智能问答的效果。

技术实现思路

[0004]本专利技术的主要目的在于提供一种语音识别方法、装置、设备及存储介质，旨在解决现有的语音识别方法准确性较差的问题。
[0005]为实现上述目的，本专利技术提供一种语音识别方法，所述语音识别方法包括：
[0006]针...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述语音识别方法包括：针对待识别语音，获取对应的初始语句文本，并对所述初始语句文本进行第一分词处理，得到第一分词结果；基于预设的同义词词典对所述第一分词结果进行分词匹配，并根据匹配情况对所述初始语句文本进行修正，得到修正语句文本；基于预设的用户词典和分词器对所述修正语句文本进行语句回测；根据语句回测结果获得对应的语音识别结果。2.如权利要求1所述的语音识别方法，其特征在于，所述对所述初始语句文本进行第一分词处理，得到第一分词结果的步骤，包括：通过n
‑
gram分词法对所述初始语句文本进行第一分词处理，得到第一分词结果。3.如权利要求1所述的语音识别方法，其特征在于，所述第一分词结果包括第一分词词条，所述基于预设的同义词词典对分词结果进行分词匹配的步骤，包括：基于预设的同义词词典，分别对各第一分词词条进行字符匹配和拼音匹配，得到各第一分词词条对应的词组。4.如权利要求3所述的语音识别方法，其特征在于，所述根据匹配情况对所述初始语句文本进行修正，得到修正语句文本的步骤包括：利用所述词组中的标准词条替换所述第一分词词条，并根据替换结果得到修正语句文本。5.如权利要求1所述的语音识别方法，其特征在于，所述基于预设的用户词典和分词器对所述修正语句文本进行语句回测的步骤，包括：通过所述分词器对所述修正语句...

【专利技术属性】
技术研发人员：贾敬伍，赵国庆，周长安，
申请(专利权)人：北京中关村科金技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人