The invention provides a speech recognition method and a device for children. Among them, the method includes: to establish the acoustic model and language model of speech signal; receiving the children, and the voice signal acquisition front-end processing; the acoustic characteristics of speech signal; decoding search through the acoustic characteristics of the acoustic model and the language model of the speech signal, in order to obtain the recognition of text to understand; semantic processing of the text recognition, to obtain semantic understanding results; wherein the establishment of acoustic model include: feature extraction processing of the speech corpus in all speech corpus, and extract into the vocal tract normalization processing technology in the feature. The speech recognition method of the invention, according to the children's channel is short, articulation rate changes, meaningless words help the sound more pronunciation characteristics more effectively analysis of children's language instruction, greatly improve the speech recognition rate of children.
【技术实现步骤摘要】
针对儿童的语音识别方法及装置
本专利技术涉及语音识别领域,特别是涉及一种针对儿童的语音识别方法及装置。
技术介绍
随着智能移动终端技术和语音交互技术高速发展,以及语音交互技术在智能移动终端的广泛应用,使得智能移动终端具备语音交互功能。通常的语音交互技术中,由于受到采集难易程度和采集成本等不同因素影响,使得已知语料库中是以采集较为方便的成人语料为主,儿童语料占据比例小。但是,与成年人相比,儿童的发音有着声道长度短、发音速度变化大以及无意义语气词较多等特点,因此,采用上述已知语料库的语音识别系统对儿童语音的针对性不足,对成年人的语音进行语音识别处理的准确度要高于儿童的。
技术实现思路
本专利技术的一个目的是要提供一种至少部分地解决上述问题的针对儿童的语音识别方法以及相应的装置。特别地,本专利技术提供了一种针对儿童的语音识别方法,包括:通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述通过已知的语音语料库建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。进一步地,所述建立声学模型步骤中,根据所述全部语音语料的声学特征进行建模包括 ...
【技术保护点】
一种针对儿童的语音识别方法,包括:通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述通过已知的语音语料库建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型,其中根据所述全部语音语料的声学特征进行建模包括:对所述全部语音语料的声学特征进行建模,生成第一声学模型AM1;提取所述语音语料库中女性语音语料的声学特征,以所述AM1作为初始模型,对所述女性语音语料的声学特征进行建模,生成第二声学模型AM2;提取所述语音语料库中儿童语音语料的声学特征,以所述AM2作为初始模型,对所述儿童语音语料的声学特征进行建模,生成第三声学模型AM3,并确认所述AM3为所述声学 ...
【技术特征摘要】
2014.04.04 CN 201410136183X1.一种针对儿童的语音识别方法,包括:通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述通过已知的语音语料库建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型,其中根据所述全部语音语料的声学特征进行建模包括:对所述全部语音语料的声学特征进行建模,生成第一声学模型AM1;提取所述语音语料库中女性语音语料的声学特征,以所述AM1作为初始模型,对所述女性语音语料的声学特征进行建模,生成第二声学模型AM2;提取所述语音语料库中儿童语音语料的声学特征,以所述AM2作为初始模型,对所述儿童语音语料的声学特征进行建模,生成第三声学模型AM3,并确认所述AM3为所述声学模型。2.根据权利要求1所述的方法,其特征在于,所述建立声学模型步骤中,根据所述全部语音语料的声学特征进行建模包括:通过隐马尔科夫模型对所述全部语音语料的声学特征进行建模,以获得所述声学模型。3.根据权利要求1所述的方法,其特征在于,所述通过已知的语音语料库建立声学模型时,还包括:为儿童语音中的静音建立静音模型,并将所述静音模型加入所述声学模型,以识别儿童语音中的静音。4.根据权利要求1所述的方法,其特征在于,所述通过已知的语音语料库建立声学模型时,还包括:为儿童语音中的语气词建立语气词模型,并将所述语气词模型加入所述声学模型,以识别所述儿童语音中的语气词。5.根据权利要求4所述的方法,其特征在于,为多个语气词建立一个语气词模型,和/或,为每个语气词建立一个语气词模型。6.根据权利要求1所述的方法,其特征在于,所述通过已知的文本语料库建立语言模型包括:抽取所述文本语料库中的10%至30%的文本语料作为待变形文本语料;对所述待变形文本语料进行变形处理,以获得变形文本语料;将所述变形文本语料与所述文本语料库中未被抽取的文本语料进行合并,以获得混合...
【专利技术属性】
技术研发人员:张峰,赖伟,吴义坚,
申请(专利权)人:上海元趣信息技术有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。