当前位置: 首页 > 专利查询>李琳山专利>正文

语音训练系统及训练方法技术方案

技术编号:3047682 阅读:213 留言:0更新日期:2012-04-11 18:40
一种语音训练系统包括:一存储装置;一语音输入装置;一信号特征拾取装置;一识别装置,用以就所述信号特征拾取装置所拾取到的特征参数与储存在一个人语音模型中的语音数据进行比对:一计算器,用以根据所述识别装置的识别结果计算出与输入的学习例句的比对结果数据;一训练装置,用以根据拾取的特征参数训练所述语音模型,并更新其中的数据;一显示装置,用以显示识别和计算后以及机器逐步学习的结果。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术关于一种。由于汉语学习者的语文水平不相同,本专利技术的学习系统及方法用以训练电脑学习者的汉语语音,便于使用者正式使用学习机听写时,能最正确的辨认输入的汉语语音信号。有关汉语学习机的说明可参考申请人的台湾专利第68052号专利。该类智慧型国语听写机具有特殊设计的语音模型、音节辨认技术及中文语言模型以接收和解码输入的语音信号。由于有汉语听写机的设计,故可省去以键盘输入中文字的麻烦,降低错误率及提高中文输入的效率。然而,在申请人不断改进汉语听写机的过程中,发现如能在汉语听写机正式使用之前先训练该机器熟悉每一个使用者的发音特性,将更能提高机器辨认和中文输入的效率。本专利技术的目的在于提供一种训练汉语听写机学习不同使用者的语音特性的方法,以提高国语听写机的效率,使国语听写机更能广泛应用于各种环境中。本专利技术的另一目的在于设计一套可快速训练机器学习不同使用者的声音的学习例句。该学习例句使用最少的字句却包括所有国语的语音变化,且其训练顺序是由简入繁,前后句之间包含重叠的语音,以加深机器的学习印象;而后一句必包含前一句所没有的语音变化,使机器可以快速学会所有的语音变化。本专利技术又一目的在于设计一可显示学习例句、输入语音波形、辨认结果及辨认正确率,以及学习曲线的显示屏,以供使用者了解在训练过程中机器的逐步学习进度,提高使用者训练机器的兴趣。根据本专利技术,机器先检测使用者所输入的学习例句的语音信号的特征参数后,经一识别装置和一训练装置,前者用以识别输入的学习例句的语音至计算其辩认结果与学习例句比较的符合率,后者用使用者如学习例句的语音去训练使用者的语音模型,并更新其中的数据。经过一组学习例句的训练后,该使用者的语音模型几乎已涵盖所有他自己的语音特性,致使在正式上线使用时,能有效地根据该语音模型内的语音特性识别使用者的输入信号。本专利技术的训练系统具有一录音引导的功能,即在使用者输入学习例句训练语音时,先由系统依据标准速度、音量朗读示范,再由使用者跟着以接近的速度、音量将学习例句清晰朗读输入。如此将减低使用者发生输入错误的机会,并且能训练使用者中养成用清晰稳定的朗读方式输入语音的习惯。本专利技术的方法中,包含一测试功能,使用者能在训练过程中随时用不同程度的测试例句检测机器的学习程度,以助于了解训练的进展。为达到上述目的,本专利技术采取如下方案本专利技术的语音训练系统,其包括一储存学习例句的存储装置;一语音输入装置,使用者经由此装置输入训练用的学习例句的语音信号;一信号特征拾取装置,用以检测和拾取所述输入语音装置输入的语音信号的特征参数;一识别装置,用以就所述信号特征拾取装置所拾取到的特征参数与储存在一个人语音模型中的语音数据进行比对一计算器,用以根据所述识别装置的识别结果计算出与输入的学习例句的比对结果数据;一训练装置,用以根据拾取的特征参数训练所述语音模型,并更新其中的数据;和一显示装置,用以显示识别和计算后以及机器逐步学习的结果。本专利技术的语音训练方法包括下列步骤(a)将学习例句输入到语音输入装置;(b)以录音引导方式引导使用者以最利于学习的速度、音量朗读学习例句,并以自动检错装置纠正不正确的速度、音量;(c)对输入的语音信号做分析,拾取其语音特征参数(d)就语音特征参数与使用者个人语音模型进行比对获得识别结果,并计算及统计该识别结果与原学习例句的符合率;(e)使用所述语音特征参数训练使用者的个人语音模型,并将结果更新储存于所述语音模型中(f)将识别结果以及统计后的机器学习结果数值显示于显示屏幕上。结合较佳实施例及附图,对本专利技术的特点说明如下附图说明图1本专利技术的汉语学习系统的电路方框图;图2本专利技术的汉语学习系统使用方法的流程图;图3本专利技术的识别装置的电路方框图;图4本专利技术的训练系统的电路方框图;图5本专利技术做线上测试的流程图;图6本专利技术的显示屏幕的示意图;图7本专利技术做线上测试时,其显示屏幕的示意图。本专利技术的语音学习系统配合申请人的台湾第68052号专利的国语语音听写机使用。其目的是在使用者正式使用国语听写机之前,先训练电脑使用者的声音特性,以使在正式上线使用时,电脑可以更高的识别率输出使用者的输入语音。如图1所示,即为本专利技术的训练系统的电路方框图。使用者朗读的学习例句的语音是经由一传声器8输入系统中。在本专利技术的电脑系统中设有一公用的语音模型3,其内储存多数人的男声或女声的语音所训练成的语音模型,这是电脑系统已预设的标准发音模式。因此,在使用者尚未输入他自己的声音前,需先设定使用该公用的语音模型3作为他自己的个人语音模型4的起始模型,并由这个起始模型来逐步训练成他自己的个人模型4。在训练过程中,训练的学习例句是经过特别的设计,使其内容在最少字句下包含汉语最多的声音变化,例如所有声母、韵母、音调、音节、速音等的学习,且其难易程度由简入繁,句长由短而长,已学过的语音特性中愈重要者并将重覆出现在接下来的例句中愈多次,以加强电脑系统的学习程度。此类例句可储存于电脑系统的一个只读存储器中(图1中未示明)。本专利技术的电脑系统尚包含一扩音元件(图1中未显示),使用者在输入此学习例句时,先由系统经该扩音元件先行输出该例句的引导发音,学习用稳定的速度、音量及清晰朗读的方式经传声器8将学习例句输入电脑中。除了其公用的语音模型3、个人语音模型4以外,本专利技术的训练系统包括一训练装置1、一识别装置2、一统计当时识别结果及符合率的计算器5以及一显示屏幕7。为便于多个不同人使用一台国语听写机,系统并可为不同使用者分别建立其个人语音模型4,而储存于该个人语音模型中,以利后续处理。图2所示为本专利技术的训练汉语听写机学习使用的方法流程图。根据本专利技术,训练用的学习例句储存于一电脑系统的只读存储器中,亦可储存于一分开的磁盘上。在输入学习例句之前,使用者必须先设定其专用的个人语音模型(如图1的元件4)(步骤205),此语音模型是先自系统内建的公用语音模型(图1中的元件3)中复制男声或女声的公用语音模型,在首次输入使用者语音时,电脑的中央处理单元(未显示)先将输入的使用者语音和公用语音模型进行比对,一面进行识别(步骤203),一面进行即时训练(步骤204),将公用模型朝使用者语音特性的方向作调整,再将调整结果存入使用者的个人语音模型中,成为初步训练后的个人语音模型。而在接下来的使用者语音输入时,才比对该初步训练后的个人语音模型中已调整过的语音模型,并以比较结果进一步更新其内容。当输入的学习例句愈多,个人语音模型就会愈来愈接近使用者的语音特性,识别正确率也就愈高。如图2所示,使用者的语音信号是经一传声器8而输入电脑系统中。根据本专利技术,学习例句显示于电脑屏幕上,并由系统经扩音元件先做清晰朗读示范。以系统示范发音的优点是有利于使用者熟悉最适合机器的声音的音量、速度及清晰朗读的方式,故其效果较佳。经过传声器输入语音信号后,系统乃先对输入语音做端点检测(步骤201),以拾取其中的特征参数(步骤202),再将该特征参数送至系统的识别装置(图1中的元件2)和进行即将识别(图2中的步骤203)训练装置(图1中元件1)中,以进行即时训练(图2中的步骤204)。本专利技术的语音特征拾取方式已在专利专利技术第68052号中说明。图3所示即为图1的识别装置(元件2)的识别步骤。请参考图3所示,辩认语音步本文档来自技高网...

【技术保护点】
一种语音训练系统,其包括: 一储存学习例句的存储装置; 一语音输入装置,使用者经由此装置输入训练用的学习例句的语音信号; 一信号特征拾取装置,用以检测和拾取所述输入语音装置输入的语音信号的特征参数; 一识别装置,用以就所述信号特征拾取装置所拾取到的特征参数与储存在一个人语音模型中的语音数据进行比对: 一计算器,用以根据所述识别装置的识别结果计算出与输入的学习例句的比对结果数据; 一训练装置,用以根据拾取的特征参数训练所述语音模型,并更新其中的数据;和 一显示装置,用以显示识别和计算后以及机器逐步学习的结果。

【技术特征摘要】
1.一种语音训练系统,其包括一储存学习例句的存储装置;一语音输入装置,使用者经由此装置输入训练用的学习例句的语音信号;一信号特征拾取装置,用以检测和拾取所述输入语音装置输入的语音信号的特征参数;一识别装置,用以就所述信号特征拾取装置所拾取到的特征参数与储存在一个人语音模型中的语音数据进行比对一计算器,用以根据所述识别装置的识别结果计算出与输入的学习例句的比对结果数据;一训练装置,用以根据拾取的特征参数训练所述语音模型,并更新其中的数据;和一显示装置,用以显示识别和计算后以及机器逐步学习的结果。2.根据权利要求1所述的训练系统,其特征在于,所述个人语音模型为一个人专用的语音模型,该系统包括一共用语音模型,其内储存多个男声与女声的标准语音数据,个人语音模型最初由所述共用语音模型构成,经过逐次输入使用者的个人语音信号后,再逐步学习使用者的语音,训练成使用者的个人语音模型。3.根据权利要求1所述的系统,其特征在于,所述识别装置包括一数字信号处理器,用以将模拟语音特征信号转换为数字信号以拾取其中的特征参数;和一隐藏式马可夫识别模型,用以将所述特征参数与所述语音模型内的预存数据进行比对,比对结果输出至所述计算器以作计算,并送至一语音信号解码器中,经解码后,输出一串对应的中文字串,并显示于所述显示装置上。4.根据权利要求1所述的系统,其特征在于,所述训练装置还包括一隐藏式马可夫模型训练器,用以利用使用者的语音特征参数训练语音模型,并将其储存于该使用者的个人语音模型中。5.根据权利要求1所述的系统,其特征在于,所述显示装置显示训练的学习例句,输入语音波形、识别及计算后的相符率、学习例句的训练率”以及机器逐步学习使用者声音的学习曲线等各种让使用者了解机器逐步学习的数据。6.根据权利要求1所述的系统,其特征在于,还包括一线上测试装置,该装置包括一预先储存测试例句的存储器,选择线上测试,即从存储器内提取例如有最高及最低训练率的多种欲测试例句,经使用者根据例句,输入信号后,即送至所述信号特征拾取装置及识别装置中处理,并经所述计算器计算比对结果。7.一种适用于权利要求1-6系统的语音...

【专利技术属性】
技术研发人员:李琳山
申请(专利权)人:李琳山
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1