针对儿童的语音识别方法及装置制造方法及图纸

技术编号:15400525 阅读:155 留言:0更新日期:2017-05-24 10:20
本发明专利技术提供了一种针对儿童的语音识别方法及装置。其中,该方法包括:建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术。通过本发明专利技术的语音识别方法,能够根据儿童声道短、发音速度变化大、无意义助声词较多等发音特点更有效地解析儿童的语言指令,大幅度提高儿童语音识别率。

Speech recognition method and device for children

The invention provides a speech recognition method and a device for children. Among them, the method includes: to establish the acoustic model and language model of speech signal; receiving the children, and the voice signal acquisition front-end processing; the acoustic characteristics of speech signal; decoding search through the acoustic characteristics of the acoustic model and the language model of the speech signal, in order to obtain the recognition of text to understand; semantic processing of the text recognition, to obtain semantic understanding results; wherein the establishment of acoustic model include: feature extraction processing of the speech corpus in all speech corpus, and extract into the vocal tract normalization processing technology in the feature. The speech recognition method of the invention, according to the children's channel is short, articulation rate changes, meaningless words help the sound more pronunciation characteristics more effectively analysis of children's language instruction, greatly improve the speech recognition rate of children.

【技术实现步骤摘要】
针对儿童的语音识别方法及装置
本专利技术涉及语音识别领域,特别是涉及一种针对儿童的语音识别方法及装置。
技术介绍
随着智能移动终端技术和语音交互技术高速发展,以及语音交互技术在智能移动终端的广泛应用,使得智能移动终端具备语音交互功能。通常的语音交互技术中,由于受到采集难易程度和采集成本等不同因素影响,使得已知语料库中是以采集较为方便的成人语料为主,儿童语料占据比例小。但是,与成年人相比,儿童的发音有着声道长度短、发音速度变化大以及无意义语气词较多等特点,因此,采用上述已知语料库的语音识别系统对儿童语音的针对性不足,对成年人的语音进行语音识别处理的准确度要高于儿童的。
技术实现思路
本专利技术的一个目的是要提供一种至少部分地解决上述问题的针对儿童的语音识别方法以及相应的装置。特别地,本专利技术提供了一种针对儿童的语音识别方法,包括:通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述通过已知的语音语料库建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。进一步地,所述建立声学模型步骤中,根据所述全部语音语料的声学特征进行建模包括:通过隐马尔科夫模型对所述全部语音语料的声学特征进行建模,以获得所述声学模型。进一步地,根据所述全部语音语料的声学特征进行建模,以获得所述声学模型包括:对所述全部语音语料的声学特征进行建模,生成第一声学模型AM1;提取所述语音语料库中女性语音语料的声学特征,以所述AM1作为初始模型,对所述女性语音语料的声学特征进行建模,生成第二声学模型AM2;提取所述语音语料库中儿童语音语料的声学特征,以所述AM2作为初始模型,对所述儿童语音语料的声学特征进行建模,生成第三声学模型AM3,并确认所述AM3为所述声学模型。进一步地,所述通过已知的语音语料库建立声学模型时,还包括:为儿童语音中的静音建立静音模型,并将所述静音模型加入所述声学模型,以识别儿童语音中的静音。进一步地,所述通过已知的语音语料库建立声学模型时,还包括:为儿童语音中的语气词建立语气词模型,并将所述语气词模型加入所述声学模型,以识别所述儿童语音中的语气词。进一步地,为多个语气词建立一个语气词模型,和/或,为每个语气词建立一个语气词模型。进一步地,所述通过已知的文本语料库建立语言模型包括:抽取所述文本语料库中的10%至30%的文本语料作为待变形文本语料;对所述待变形文本语料进行变形处理,以获得变形文本语料;将所述变形文本语料与所述文本语料库中未被抽取的文本语料进行合并,以获得混合文本语料库;对所述混合文本语料库进行建模,以获得所述语言模型;其中对所述待变形文本语料进行变形处理包括;对所述待变形文本语料中所有的语句进行分词处理;在经过所述分词处理的所述待变形文本语料中,随机选择至少一个词进行重复处理,以获得所述变形文本语料。进一步地,随机选择至少一个词进行重复处理,包括以下至少之一:随机选择至少一个词进行词重复处理;随机选择至少一个词进行词尾重复处理;随机选择至少一个词进行助声词增多处理,其中,所述助声词增多处理包括在所述待变形文本语料中,随机在两个词之间增加至少一个语气词。进一步地,对所述识别文本进行语义理解处理包括如下步骤中的至少一个:通过对所述识别文本进行常规词语法分析,去除所述识别文本中连续出现重复的词,以获得所述语义理解结果;通过对所述识别文本进行常规词语法分析,去除所述识别文本中词尾重复的叠词,以获得所述语义理解结果;通过对所述识别文本进行常规词语法分析和句法分析,去除所述识别文本中词与词之间多余的语气词,以获得所述语义理解结果。依据本专利技术的另一方面,还提供了一种针对儿童的语音识别装置,包括:模型建立模块,配置为通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收模块,配置为接收所述儿童的语音信号,并对所述语音信号进行前端处理;特征提取处理模块,配置为对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;识别文本获得模块,配置为通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;语义理解处理模块,配置为对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述模型建立模块还配置为通过以下步骤建立声学模型:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。本专利技术实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本专利技术实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本专利技术实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本专利技术的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。综上,本专利技术实施例提供的针对儿童的语音识别方法能够解决现有技术中对儿童语音识别不准的问题,达到合理高效提高儿童语音的识别率的有益效果。根据下文结合附图对本专利技术具体实施例的详细描述,本领域技术人员将会更加明了本专利技术的上述以及其他目的、优点和特征。附图说明后文将参照附图以示例性而非限制性的方式详细描述本专利技术的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。附图中:图1示出了根据本专利技术一个实施例的针对儿童的语音识别方法的流程图;图2示出了根据本专利技术一个实施例的声学模型建立的流程图;图3示出了根据本专利技术另一个实施例的声学模型建立的流程图;图4示出了根据本专利技术一个实施例的语言模型建立的流程图;以及图5示出了根据本专利技术一个实施例的针对儿童的语音识别装置的结构示意图。具体实施方式图1示出了根据本专利技术一个实施例的针对儿童的语音识别方法的处理流程图。参见图1,本专利技术实施例的语音识别方法至少包括通过现有语音识别系统进行语音识别的步骤S101至步骤S105。在步骤S101中,通过已知的语音语料库和文本语料库分别建立声学模型和语言模型。其中,语音语料库和文本语料库可以采用已有的适合的语音语料库和文本语料库,并且语音语料库和文本语料库中均是成人的数据量远大本文档来自技高网...
针对儿童的语音识别方法及装置

【技术保护点】
一种针对儿童的语音识别方法,包括:通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述通过已知的语音语料库建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型,其中根据所述全部语音语料的声学特征进行建模包括:对所述全部语音语料的声学特征进行建模,生成第一声学模型AM1;提取所述语音语料库中女性语音语料的声学特征,以所述AM1作为初始模型,对所述女性语音语料的声学特征进行建模,生成第二声学模型AM2;提取所述语音语料库中儿童语音语料的声学特征,以所述AM2作为初始模型,对所述儿童语音语料的声学特征进行建模,生成第三声学模型AM3,并确认所述AM3为所述声学模型。...

【技术特征摘要】
2014.04.04 CN 201410136183X1.一种针对儿童的语音识别方法,包括:通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述通过已知的语音语料库建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型,其中根据所述全部语音语料的声学特征进行建模包括:对所述全部语音语料的声学特征进行建模,生成第一声学模型AM1;提取所述语音语料库中女性语音语料的声学特征,以所述AM1作为初始模型,对所述女性语音语料的声学特征进行建模,生成第二声学模型AM2;提取所述语音语料库中儿童语音语料的声学特征,以所述AM2作为初始模型,对所述儿童语音语料的声学特征进行建模,生成第三声学模型AM3,并确认所述AM3为所述声学模型。2.根据权利要求1所述的方法,其特征在于,所述建立声学模型步骤中,根据所述全部语音语料的声学特征进行建模包括:通过隐马尔科夫模型对所述全部语音语料的声学特征进行建模,以获得所述声学模型。3.根据权利要求1所述的方法,其特征在于,所述通过已知的语音语料库建立声学模型时,还包括:为儿童语音中的静音建立静音模型,并将所述静音模型加入所述声学模型,以识别儿童语音中的静音。4.根据权利要求1所述的方法,其特征在于,所述通过已知的语音语料库建立声学模型时,还包括:为儿童语音中的语气词建立语气词模型,并将所述语气词模型加入所述声学模型,以识别所述儿童语音中的语气词。5.根据权利要求4所述的方法,其特征在于,为多个语气词建立一个语气词模型,和/或,为每个语气词建立一个语气词模型。6.根据权利要求1所述的方法,其特征在于,所述通过已知的文本语料库建立语言模型包括:抽取所述文本语料库中的10%至30%的文本语料作为待变形文本语料;对所述待变形文本语料进行变形处理,以获得变形文本语料;将所述变形文本语料与所述文本语料库中未被抽取的文本语料进行合并,以获得混合...

【专利技术属性】
技术研发人员:张峰赖伟吴义坚
申请(专利权)人:上海元趣信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1