【技术实现步骤摘要】
语音识别方法及装置、电子设备、计算机可读存储介质
[0001]本专利技术涉及计算机
,具体而言,涉及一种语音识别方法及装置、电子设备、计算机可读存储介质。
技术介绍
[0002]语音识别是提高各种设备的智能化程度的目重要技术,通过语音识别可以与机器进行语音交流。即,可以通过语音识别技术让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。其主要包括特征提取技术、模式匹配准则以及模型训练技术三个方面。
[0003]因此,相关技术中的语音识别系统一般是通过采集模块来采集操作人员发出的唤醒词,声学特征提取模块提取换新词的特征信息,自定义唤醒词模块输出自定义唤醒词表,发音字典生成器根据自定义换新词表和预置字典生成发音字典,语言模型生成器根据发音字典生成语言模型,解码图生成器可根据语言模型和发音字典生成一个静态解码图,解码器可根据静态解码图和通用声学模型解码,以判断语音数据是否含有换新词。
[0004]然而,上述方案存在以下弊端:1).预置词典的构建直接使用音素,会增加误唤醒;2).当唤醒词中某个字为多 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典,其中,所述目标唤醒词包含自定义唤醒词;基于所述唤醒词声学词典和所述唤醒词语言字典生成解码图;利用所述解码图对目标语音进行逐帧解码,得到语音识别结果。2.根据权利要求1所述的方法,其特征在于,在生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典之前,所述方法还包括:生成第一映射表,所述第一映射表包含汉字与该汉字的至少一个拼音之间的映射关系;其中,生成所述第一映射表,包括:使用第一分词工具对预定文本进行分词处理,得到分词结果;利用拼音生成工具为所述分词结果进行拼音标注,得到第二映射表,所述第二映射表包含词语与该词语的至少一个拼音之间的映射关系;对所述第二映射表进行解析,得到第三映射表,所述第三映射表包含所述词语中每一个字与该每一个字的至少一个拼音之间的映射关系;按照预定组合方式对所述第三映射表进行组合,得到所述第一映射表。3.根据权利要求2所述的方法,其特征在于,生成目标唤醒词对应的唤醒词声学词典,包括:获取所述目标唤醒词;利用第二分词工具对所述目标唤醒词进行分词处理,得到多个子词;对所述多个子词按照所述第一映射表进行处理,得到第四映射表,所述第四映射表包含所述多个子词中每一个子词与该每一个子词的至少一个拼音之间的映射关系;将所述第四映射表与所述第一映射表进行融合,得到所述唤醒词声学词典。4.根据权利要求2所述的方法,其特征在于,生成目标唤醒词对应的唤醒词语言字典,包括:对所述第二映射表中的汉字进行去重处理,得到汉字字典;对目标唤醒词进行分词处理,得到多个子词,并对所述多个子词进行去重处理,得到剩余子词;将所述剩余子词与所述汉字字典进行组合,得到所述唤醒词语言字典。5.根据权利要求1所述的方法,其特征在于,基于所述唤醒词声学词典和所述唤醒词语言字...
【专利技术属性】
技术研发人员:李泽轩,
申请(专利权)人:广东优碧胜科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。