一种语音识别方法及系统技术方案

技术编号:20007000 阅读:27 留言:0更新日期:2019-01-05 18:38
本发明专利技术属于语音识别领域,公开了一种语音识别方法及系统,其方法包括:根据不同地域的发音特点,建立发音词库;发音词库包括吞音词及拖音词;根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表;获取待识别语音信息;根据待识别语音信息,识别出待识别语音信息对应的地域信息;根据地域信息、声韵母映射表和发音词库,对待识别语音信息进行校正;识别校正后的待识别语音信息,得到对应的文本信息。本发明专利技术根据建立的不同地域的声韵母混用的声韵母映射表和发音词库,对获取的语音信息进行声韵母校正和词语校正,从而提高语音识别的准确率,以便更准确的了解用户的真实意图,更好的为用户服务,提高用户的使用体验。

A Speech Recognition Method and System

The invention belongs to the field of speech recognition, and discloses a speech recognition method and system, which includes: establishing a pronunciation thesaurus according to the pronunciation characteristics of different regions; a pronunciation thesaurus including swallowing words and dragging words; establishing a mapping table of consonants and vowels in different regions according to regional information; acquiring speech information to be recognized; To identify the corresponding regional information of the speech information to be recognized; to correct the recognized speech information according to the regional information, vowel mapping table and pronunciation lexicon; to identify the corrected speech information and get the corresponding text information. According to the mapping table and pronunciation lexicon of mixed consonants and vowels in different regions, the invention corrects the acquired voice information by vowels and vowels, thereby improving the accuracy of speech recognition, so as to understand the real intention of users more accurately, serve users better and improve the user's experience.

【技术实现步骤摘要】
一种语音识别方法及系统
本专利技术属于语音识别
,特别涉及一种语音识别方法及系统。
技术介绍
随着科学技术的发展,市面上出现了电子设备,例如手机、平板电脑、学习平板等,帮助学生解决作业中遇到的问题。目前,大部分的学习设备都是基于语音识别来了解学生的意图,以便对学生进行学习辅导。语音识别是一种利用机器模拟人类的识别和理解过程,把人类的语音信号转变为相应的文本或命令的技术。语音识别的根本目的是研究出一种具有听觉功能的机器,能直接接受人的语音,理解人的意图,并做出相应的反应。但是,由于小学低年级学生存在发音不准,且存在部分口音和吐字不清楚的情况,导致语音识别产品在识别小学生的语音时,出现较低的识别率,使得学习设备并不能很好的了解学生的真实意图,导致推荐的相关学习内容或解答并不是学生所需的,从而使得用户体验感较差。
技术实现思路
本专利技术的目的是提供一种语音识别方法及系统,实现提高语音识别率的目的。本专利技术提供的技术方案如下:第一方面,提供一种语音识别方法,包括:根据不同地域的发音特点,建立发音词库;所述发音词库包括吞音词及拖音词;根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表;获取待识别语音信息;根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息;根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正;识别校正后的待识别语音信息,得到对应的文本信息。优选地,所述的获取待识别语音信息之前还包括:搜集不同地域的用户语音信息;根据所述不同地域的用户语音信息,建立不同地域各自对应的地域语音特征库,并建立所述地域语音特征库与对应的地域之间的地域映射表;所述的根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息具体包括:提取出所述待识别语音信息中的语音特征;根据提取出的语音特征,查找到对应的地域语音特征库;根据查找到的地域语音特征库,在所述地域映射表中查找到对应的地域信息。优选地,所述语音特征包括语调、语速或声调中的一种或多种。优选地,所述的根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表具体包括:根据地域信息,按地域对声母混用及韵母混用进行分类;建立混用声母与对应声母之间的映射关系,以及混用韵母与对应韵母之间的映射关系;根据所述声母混用的映射关系和所述韵母混用的映射关系,建立不同地域的声母混用及韵母混用的声韵母映射表。优选地,所述的获取待识别语音信息之后还包括:根据所述待识别语音信息,更新混用声母与对应声母之间的映射关系,以及混用韵母与对应韵母之间的映射关系;根据更新后的声母映射关系以及韵母映射关系,更新所述声韵母映射表。优选地,所述的根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正具体包括:根据所述地域信息,查找到所述地域信息对应的声韵母映射表;根据所述地域信息对应的声韵母映射表,对所述待识别语音信息中的相关声母及韵母进行校正;根据所述发音词库,对进行声母及韵母校正后的所述待识别语音信息中的相关词语进行校正;所述的识别校正后的待识别语音信息,得到对应的文本信息具体包括:对进行词语校正后的待识别语音信息进行语音识别,得到对应的文本信息。第二方面,还提供一种语音识别系统,包括:词库建立模块,用于根据不同地域的发音特点,建立发音词库;所述发音词库包括吞音词及拖音词;声韵母映射表建立模块,用于根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表;语音获取模块,用于获取待识别语音信息;地域识别模块,用于根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息;语音校正模块,用于根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正;语音识别模块,用于识别校正后的待识别语音信息,得到对应的文本信息。优选地,还包括:语音搜集模块,用于搜集不同地域的用户语音信息;地域映射表建立模块,用于根据所述不同地域的用户语音信息,建立不同地域各自对应的地域语音特征库,并建立所述地域语音特征库与对应的地域之间的地域映射表;所述地域识别模块包括:语音特征提取单元,用于提取出所述待识别语音信息中的语音特征;特征库查找单元,用于根据提取出的语音特征,查找到对应的地域语音特征库;地域查找单元,用于根据查找到的地域语音特征库,在所述地域映射表中查找到对应的地域信息。优选地,所述声韵母映射表建立模块包括:分类单元,用于根据地域信息,按地域对声母混用及韵母混用进行分类;映射关系建立单元,用于建立混用声母与对应声母之间的映射关系,以及混用韵母与对应韵母之间的映射关系;声韵母映射表建立单元,用于根据所述声母混用的映射关系和所述韵母混用的映射关系,建立不同地域的声母混用及韵母混用的声韵母映射表。优选地,所述语音校正模块包括:声韵母映射表查找单元,用于根据所述地域信息,查找到所述地域信息对应的声韵母映射表;声韵母校正单元,用于根据所述地域信息对应的声韵母映射表,对所述待识别语音信息中的相关声母及韵母进行校正;词语校正单元,用于根据所述发音词库,对进行声母及韵母校正后的所述待识别语音信息中的相关词语进行校正;所述语音识别模块包括:语音识别单元,用于对进行词语校正后的待识别语音信息进行语音识别,得到对应的文本信息。与现有技术相比,本专利技术提供的一种语音识别方法及系统具有以下有益效果:1、本专利技术根据建立的不同地域的声韵母混用的声韵母映射表和发音词库,对获取的语音信息进行声韵母校正和词语校正,从而提高语音识别的准确率,以便更准确的了解用户的真实意图,更好的为用户服务,提高用户的使用体验。2、本专利技术通过获取的待识别语音信息中的语调、语速或声调,查找用户所属地域信息,由于不同地域的人,说同一句话时,其说话的语调、语速、声调等基本不会完全相同,存在一定的差别,因此,通过待识别语音信息中的这些语音特征,即可准确的查找到用户的所属地域信息,从而可提高语音的校正率。3、本专利技术通过获取的待识别语音信息,更新声韵母映射表,可针对用户进行个性化的语音校正,从而提高语音识别的准确率。4、本专利技术先根据声韵母映射表,对待识别语音信息中的混用声母及混用韵母进行校正,使得待识别语音中的发音变得更标准,能更准确的识别出待识别语音中的字词,以便更好的进行吞音及拖音的校正,从而提高语音的识别准确率。附图说明下面将以明确易懂的方式,结合附图说明优选实施方式,对一种语音识别方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。图1是本专利技术一种语音识别方法的第一实施例的流程示意图;图2是本专利技术一种语音识别方法的第二实施例的流程示意图;图3是本专利技术一种语音识别方法的第三实施例的流程示意图;图4是本专利技术一种语音识别方法的第四实施例的流程示意图;图5是本专利技术一种语音识别方法的第五实施例的流程示意图;图6是本专利技术一种语音识别方法的第六实施例的流程示意图;图7是本专利技术一种语音识别系统的一个实施例的结构示意框图;图8是本专利技术一种语音识别系统的另一个实施例的结构示意框图。附图标号说明:1、语音搜集模块;2、地域映射表建立模块;10、词库建立模块;20、声韵母映射表建立模块;21、分类单元;22、映射关系建立单元;23、声韵母映射表建立单元;30、语音获取模块;40、地域识别本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:根据不同地域的发音特点,建立发音词库;所述发音词库包括吞音词及拖音词;根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表;获取待识别语音信息;根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息;根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正;识别校正后的待识别语音信息,得到对应的文本信息。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:根据不同地域的发音特点,建立发音词库;所述发音词库包括吞音词及拖音词;根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表;获取待识别语音信息;根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息;根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正;识别校正后的待识别语音信息,得到对应的文本信息。2.根据权利要求1所述的一种语音识别方法,其特征在于,所述的获取待识别语音信息之前还包括:搜集不同地域的用户语音信息;根据所述不同地域的用户语音信息,建立不同地域各自对应的地域语音特征库,并建立所述地域语音特征库与对应的地域之间的地域映射表;所述的根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息具体包括:提取出所述待识别语音信息中的语音特征;根据提取出的语音特征,查找到对应的地域语音特征库;根据查找到的地域语音特征库,在所述地域映射表中查找到对应的地域信息。3.根据权利要求2所述的一种语音识别方法,其特征在于,所述语音特征包括语调、语速或声调中的一种或多种。4.根据权利要求1所述的一种语音识别方法,其特征在于,所述的根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表具体包括:根据地域信息,按地域对声母混用及韵母混用进行分类;建立混用声母与对应声母之间的映射关系,以及混用韵母与对应韵母之间的映射关系;根据所述声母混用的映射关系和所述韵母混用的映射关系,建立不同地域的声母混用及韵母混用的声韵母映射表。5.根据权利要求1所述的一种语音识别方法,其特征在于,所述的获取待识别语音信息之后还包括:根据所述待识别语音信息,更新混用声母与对应声母之间的映射关系,以及混用韵母与对应韵母之间的映射关系;根据更新后的声母映射关系以及韵母映射关系,更新所述声韵母映射表。6.根据权利要求1-5任一项所述的一种语音识别方法,其特征在于,所述的根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正具体包括:根据所述地域信息,查找到所述地域信息对应的声韵母映射表;根据所述地域信息对应的声韵母映射表,对所述待识别语音信息中的相关声母及韵母进行校正;根据所述发音词库,对进行声母及韵母校正后的所述待识别语音信息中的相关词语进行校正;所述的识...

【专利技术属性】
技术研发人员:魏誉荧
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1