当前位置: 首页 > 专利查询>河南工学院专利>正文

一种语音识别方法技术

技术编号:20223150 阅读:41 留言:0更新日期:2019-01-28 21:16
本发明专利技术公开了一种语音识别方法,该语音识别方法包括:利用第一语音识别方法识别所述语音信息得到第一语音识别结果,利用第二语音识别方法识别所述语音信息得到第二语音识别结果;及比对第一语音识别结果及所述第二语音识别结果,根据比对结果,输出语音识别结果,并显示。通过该方案,可以有效地解决语音数据关键信息的关联度检测,增加语音识别的成功率。

【技术实现步骤摘要】
一种语音识别方法
本专利技术涉及语音识别领域,尤其涉及一种语音识别方法。
技术介绍
语音识别作为当前发展的新兴研究方向,语音识别主要有以下五个问题:⒈对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。⒉语音信息量大。语音模式不仅对不同的说话人不同,对同一说话人也是不同的,例如,一个说话人在随意说话和认真说话时的语音信息是不同的。一个人的说话方式随着时间变化。⒊语音的模糊性。说话者在讲话时,不同的词可能听起来是相似的。这在英语和汉语中常见。⒋单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等。⒌环境噪声和干扰对语音识别有严重影响,致使识别率低。。针对上述问题,科学家们将机器学习领域深度学习研究引入到语音识别声学模型训练,使用带RBM预训练的多层神经网络,极大提高了声学模型的准确率。在此方面,微软公司的研究人员率先取得了突破性进展,他们使用深层神经网络模型(DNN)后,语音识别错误率降低了30%,是近20年来语音识别技术方面最快的进步。但是,大多主流的语音识别解码器已经采用基于有限状态机(WFST)的解码网络,该本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,该语音识别方法包括:获取语音信息;利用第一语音识别方法识别所述语音信息得到第一语音识别结果,利用第二语音识别方法识别所述语音信息得到第二语音识别结果;及比对第一语音识别结果及所述第二语音识别结果,根据比对结果,输出语音识别结果,并显示。

【技术特征摘要】
1.一种语音识别方法,其特征在于,该语音识别方法包括:获取语音信息;利用第一语音识别方法识别所述语音信息得到第一语音识别结果,利用第二语音识别方法识别所述语音信息得到第二语音识别结果;及比对第一语音识别结果及所述第二语音识别结果,根据比对结果,输出语音识别结果,并显示。2.一种如权利要求1所述的语音识别方法,所述根据比对结果,输出语音识别结果的具体方法为:S1:为所述第一语音识别结果与第二语音识别结果进行比较,如果第一语音识别结果与第二语音识别结果覆盖率低于设定阈值,则执行如下步骤,其中所述覆盖率是指完全重复的比率,从第一个字符开始注意比对,比对相同的字符数占总字符数的比率:判断第一语音识别结果与第二语音识别结果的字符数是否相同;1)若相同,将第一语音识别结果与第二语音识别结果进行匹配,统计匹配数量;并计算相似度R:R=Q(R1,R2)/Max(|R1|,|R2|);Q(R1,R2),表示R1、R2中相同的数量;即第一语音识别结果与第二语音识别结果中相同的数量;Max(|R1|,|R2|)表示R1、R2中的最大值;执行S2;2)若不相同,将第一语音识别结果与第二语音识别结果的无关字符删除,包括:将停用字符、连续相同的字符删除;得到修正后的第一语音识别结果与修正后的第二语音识别结果;再次判断修正后的第一语音识别结果与修正后的第二语音识别结果的字符数是否相同,若相同,则R=Q(R1,R2)/Max(|R1|,|R2|);Q(R1,R2),表示R1、R2中相同的数量;即修正后的第一语音识别结果与修正后的第二语音识别结果中相同的数量;Max(|R1|,|R2|)表示R1、R2中的最大值;执行S2;若修正后的第一语音识别结果与修正后的第二语音识别结果的字符数不相同,分别从前至后比较修正后的第一语音识别结果与修正后的第二语音识别结果,并计算相似度RA:RA=Q1(R1,R2)/Max(|R1|,|R2|);Q1(R1,R2),表示从前至后比较修正后的第一语音识别结果与修正后的第二语音识别结果中相同的数量;Max(|R1|,|R2|)表示R1、R2中的最大值;从后至前比较修正后的第一语音识别结果与修正后的第二语音识别结果,并计算相似度RB:RB=Q2(R1,R2)/Max(|R1|,|R2|);Q2(R1,R2),表示从后至前比较修正后的第一语音识别结果与修正后的第二语音识别结果中相同的数量;Max(|R1|,|R2|)表示R1、R2中的最大值;比较RA、RB,R=max(RA,RB);执行S2;S2:如果R小于指定值,则摒弃该识别结果,重新采样。3.一种如权利要求2所述的语音识别方法,其特征在于,在获取语音信息后,对所述语音信息进行预处理;所述预处理方法包括流利程度检测,端点检测,预加重,分帧,加窗;1)端点检测所述端点检测采用如下方式:设定时间阈值T0、时间间隔△t、声音阈值V0,通过音频信号采集电路进行信号采集,连续采集N个时间节点的的声音信号,N>T0/...

【专利技术属性】
技术研发人员:马世辉刘学军李进波
申请(专利权)人:河南工学院
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1