语音识别方法及装置、设备、计算机可读存储介质制造方法及图纸

技术编号:28843134 阅读:15 留言:0更新日期:2021-06-11 23:42
本发明专利技术涉及语音识别技术领域,公开了一种语音识别方法及装置、设备、计算机可读存储介质。本发明专利技术通过若监测接收到第一语音信息,则对第一语音信息进行声学特征提取,得到第一声学特征信息,然后利用解码器对第一声学特征信息进行解码,得到解码识别结果,再将解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果,进而输出匹配结果,以实现语音识别;解决了相关技术中语音识别的准确率差的问题。

【技术实现步骤摘要】
语音识别方法及装置、设备、计算机可读存储介质
本专利技术涉及语音识别
,尤其涉及一种语音识别方法及装置、设备、计算机可读存储介质。
技术介绍
随着计算机技术和信号处理技术的快速发展,健壮性语音识别已达到真正意义上的应用,能够实现自由的人机交互;但是,目前的语音识别准确率较低,例如在识别专有名词复合词如Editor-in-Chief、缩略词如UFO、人名如Jessie、地名如Beijing等的过程中识别准确率都较低,由此大大降低了用户的使用体验。因此,如何提升语音识别的准确率是亟待解决的问题。
技术实现思路
本专利技术的主要目的在于提供语音识别方法及装置、设备、计算机可读存储介质,旨在提升语音识别的准确率。为实现上述目的,本专利技术提供一种语音识别方法,所述语音识别方法包括以下步骤:若监测接收到第一语音信息,则对所述第一语音信息进行声学特征提取,得到第一声学特征信息;利用解码器对所述第一声学特征信息进行解码,得到解码识别结果;将所述解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果;输出所述匹配结果,以实现语音识别。可选的,所述将所述解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果的步骤,包括:遍历预设专有名词词汇表中的词串;将所述解码识别结果中的词串分别和遍历到的所述预设专有名词词汇表中的词串进行模式匹配;将所述解码识别结果中匹配的词串替换为所述预设专有名词词汇表中的词串,以得到匹配结果。可选的,所述将所述解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果的步骤之前,所述语音识别方法还包括:采集第二语音信息;对所述第二语音信息进行语音识别,得到包含专有名词的字符序列;根据所述包含专有名词的字符序列,生成预设专有名词词汇表。可选的,所述利用解码器对所述第一声学特征信息进行解码,得到解码识别结果的步骤,包括:获取发音词典、语言模型以及声学模型;根据所述发音词典、语言模型以及声学模型构造解码器;利用所述解码器对所述第一声学特征信息进行解码,得到解码识别结果。可选的,所述利用所述解码器对所述第一声学特征信息进行解码,得到解码识别结果的步骤之前,所述语音识别方法还包括:获取语音语料;对所述语音语料进行声学特征提取,得到第二声学特征信息;对所述第二声学特征信息进行训练,得到声学模型。可选的,所述利用解码器对所述声学特征信息进行解码,得到解码识别结果的步骤之前,所述语音识别方法还包括:获取文本语料;从所述文本语料中获取使用频率高于预设阈值的中文词和/或单词;根据使用频率高于预设阈值的中文词和/或单词,生成构造词汇表;对所述构造词汇表进行训练,得到语言模型。可选的,所述利用解码器对所述声学特征信息进行解码,得到解码识别结果的步骤之前,所述语音识别方法还包括:获取声学模型和语言模型;根据所述声学模型中的音素和所述语言模型中的中文词,建立音素与中文词的映射关系,以及根据所述声学模型中的音素和所述语言模型中的单词,建立音素与单词的映射关系;根据所述音素与中文词的映射关系以及音素与单词的映射关系,得到发音词典。此外,为实现上述目的,本专利技术还提供一种语音识别装置,语音识别装置包括:提取模块,用于若监测接收到第一语音信息,则对所述第一语音信息进行声学特征提取,得到第一声学特征信息;解码模块,用于利用解码器对所述第一声学特征信息进行解码,得到解码识别结果;匹配模块,用于将所述解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果;输出模块,用于输出所述匹配结果,以实现语音识别。此外,为实现上述目的,本专利技术还提供一种设备,所述设备包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行语音识别程序,所述语音识别程序被所述处理器执行时实现如上文的语音识别方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音识别程序,语音识别程序被处理器执行时实现如上文的语音识别方法的步骤。本专利技术提供的技术方案,通过若监测接收到第一语音信息,则对第一语音信息进行声学特征提取,得到第一声学特征信息,然后利用解码器对第一声学特征信息进行解码,得到解码识别结果,再将解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果,进而输出匹配结果,以实现语音识别;解决了相关技术中语音识别的准确率差的问题。也即本专利技术提供的技术方案,通过首先由解码器对接收到的第一语音信息提取到的第一声学特征信息进行解码,得到解码识别结果,再将该解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果;即对解码器进行解码得到的解码识别结果进行了进一步地匹配,避免了由解码器进行解码进而直接输出解码识别结果,造成语音识别准确率低的现象,提升了语音识别准确率,进而提升了用户的使用体验满意度。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1是本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;图2为本专利技术语音识别方法第一实施例的流程示意图;图3为本专利技术语音识别方法第二实施例的流程示意图;图4为本专利技术语音识别方法第三实施例的流程示意图;图5为本专利技术语音识别方法第四实施例的流程示意图;图6为本专利技术语音识别装置第一实施例的结构框图;图7为本专利技术语音识别装置第一实施例执行语音识别方法的示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。请参见图1所示,图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图。设备包括:至少一个处理器101、存储器102以及存储在存储器上并可在处理器上运行的语音识别程序,语音识别程序配置为实现如下任一实施例的语音识别方法的步骤。处理器101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器101可以采用DSP(DigitalSignalProcessing,数字信号处理)、FPGA(Field-ProgrammableGateArray,现场可编程门阵列)、PLA(ProgrammableLogicArray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器101也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CP本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述语音识别方法包括以下步骤:/n若监测接收到第一语音信息,则对所述第一语音信息进行声学特征提取,得到第一声学特征信息;/n利用解码器对所述第一声学特征信息进行解码,得到解码识别结果;/n将所述解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果;/n输出所述匹配结果,以实现语音识别。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述语音识别方法包括以下步骤:
若监测接收到第一语音信息,则对所述第一语音信息进行声学特征提取,得到第一声学特征信息;
利用解码器对所述第一声学特征信息进行解码,得到解码识别结果;
将所述解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果;
输出所述匹配结果,以实现语音识别。


2.如权利要求1所述的语音识别方法,其特征在于,所述将所述解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果的步骤,包括:
遍历预设专有名词词汇表中的词串;
将所述解码识别结果中的词串分别和遍历到的所述预设专有名词词汇表中的词串进行模式匹配;
将所述解码识别结果中匹配的词串替换为所述预设专有名词词汇表中的词串,以得到匹配结果。


3.如权利要求2所述的语音识别方法,其特征在于,所述将所述解码识别结果中的词串和预设专有名词词汇表中的词串进行模式匹配,得到匹配结果的步骤之前,所述语音识别方法还包括:
采集第二语音信息;
对所述第二语音信息进行语音识别,得到包含专有名词的字符序列;
根据所述包含专有名词的字符序列,生成预设专有名词词汇表。


4.如权利要求1-3中任一项所述的语音识别方法,其特征在于,所述利用解码器对所述第一声学特征信息进行解码,得到解码识别结果的步骤,包括:
获取发音词典、语言模型以及声学模型;
根据所述发音词典、语言模型以及声学模型构造解码器;
利用所述解码器对所述第一声学特征信息进行解码,得到解码识别结果。


5.权利要求4所述的语音识别方法,其特征在于,所述利用所述解码器对所述第一声学特征信息进行解码,得到解码识别结果的步骤之前,所述语音识别方法还包括:
获取语音语料;
对所述语音语料进行声学特征提取,得到第二声学特征信息;
...

【专利技术属性】
技术研发人员:陈文明冯兵兵邓高锋张世明
申请(专利权)人:虫洞创新平台深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1