一种语音输出/输入系统与方法技术方案

技术编号:3046427 阅读:349 留言:0更新日期:2012-04-11 18:40
一种语音输出/输入系统,包括:    一语音输入单元,接收外界语音,输出一语音信号;    一语音处理单元,连接该语音输入单元,处理该语音信号,输出一语音输出信号;该语音处理单元包括:    复数个语音处理模块,其中每一语音处理模块对该语音信号进行一特定处理,该复数个语音处理模块依一预设顺序处理该语音信号;及    一分派模块,连接复数个语音处理模块,用以控制复数个语音处理模块的处理流程;以及    一语音输出单元,连接该语音处理单元,播放该语音输出信号;    其特征在于该语音输入单元将所接收的外界语音以句子(sentence)为单位切出,输出为该语音信号;每一语音处理模块通常为备用(standby)状态,当接收到该分派模块所传送致能(enable)信号时,转变为工作状态;每一语音处理模块以一语音信号为处理单位,处理该语音信号,完成后转变为备用状态,并通知该分派模块。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种语音输出/输入装置与方法,特别是一种利用同步处理技术,以加快处理速度的语音输出/输入装置与方法。
技术介绍
随着语音信号处理技术的发展,让计算机听得懂人类的语言也不再只是梦想。目前市面上可以看到许多的语音辨识产品,如语音输入法(声硕科技说亦通、蒙恬科技听写王),行动电话的语音简讯精灵,皆是语音辨识的应用实例。在个人行动数字产品要求轻薄短小的趋势下,语音输入的技术将更显重要。然而,目前在语音处理的应用上,处理速度缓慢一直是人们希望解决的问题。请参阅图1,此为已知的语音处理流程图。使用者发出语音信号,经由麦克风接收后,传送到语音处理装置。语音处理装置首先要做的就是要将麦克风所撷取的模拟(analogical)语音信号转换为数字(digital)信号,即所谓的模拟/数字转换(A/D conversion)。接着对数字的语音信号进行前置处理,通常包括有去除高频噪声与还原声道模型,增加输入信号的品质,以提高辨识率。之后进入语音辨识的步骤,首先从经过前置处理的语音信号中撷取特征参数,再与事先训练好的语音模型进行比对,将可能性较大的结果再经由语言模型,取出有意义的文字结果,最后输出。由图1及上述步骤说明中可知,语音辨识的步骤相当繁琐,而且为序列式的处理流程,必须待前一步骤执行完毕后,方可执行下一步骤,直到所有步骤结束后,才能再从头开始执行。因此处理过程中就会花费不少时间,使用者就会有等待感觉。请参阅图2,此为台湾公告第502207号“具语音辨识的卡路里控制设备”处理示意图,由图2可看出,当语音讯号经过麦克风输入后,必须遵循语音输入单元→语音辨识单元→算数及控制单元的步骤,其中语音输入单元无法将目前输入的状态直接告知算数与控制单元,而算数与控制单元也无法直接控制语音输入单元,造成同一时间内只有一个单元在工作,其它单元闲置的现象。此外,常用技术在处理语音信号时,必须暂时停止对外界语音讯号的接收或前置处理等动作,以空出中央处理单元(CPU)的资源来进行语音辨识。如此做法对于不能达到真正同步接收与辨识的现象并未彻底解决,而且在此缺憾的下很可能遗失极为重要的语音讯号,降低系统可信赖度。
技术实现思路
本专利技术的主要目的是提供一种可以加快语音处理的装置与方法。为达本专利技术的目的,本专利技术提供一种语音输出/输入装置,包括一语音输入单元,接收外界语音,输出一语音信号;一语音处理单元,连接该语音输入单元,处理该语音信号,输出一语音输出信号;该处理单元包括复数个语音处理模块,其中每一语音处理模块对该语音信号进行一特定处理,该复数个语音处理模块依一预设顺序处理该语音信号;及一分派模块,连接复数个处理模块,用以控制复数个处理模块的处理流程;以及一语音输出单元,连接该处理单元,播放该语音输出信号;其特征在于该语音输入单元将所接收的外界语音以句子(sentence)为单位切出,输出为该语音信号;每一语音处理模块通常为备用(standby)状态,当接收到该分派模块所传送一致能(enable)信号时,转变为工作状态,每一语音处理模块以一语音信号为处理单位,处理该语音信号,完成后转变为备用状态,并通知该分派模块。在此要强调的是,分派模块可以同时送出多个致能信号,使多个语音处理模块能同时处理不同的信号。本专利技术也提供一种语音处理方法,用于一语音输出/输入装置,该装置包括一语音输入单元,接收外界语音,以句子(sentence)为单位,输出复数个语音信号;复数个处理模块,其中该复数个处理模块依一预设顺序处理输入信息;一分派模块;一储存单元与一语音输出单元,该方法包括以下步骤步骤A该分派模块检验一语音信号是否已完成处理,若为是,输出至该语音输出单元播放,否则执行步骤B;步骤B该分派模块依该预设顺序检验该语音信号下一个处理模块是否为备用状态?若为是,执行步骤C,否则执行步骤F;步骤C将该处理模块转换成工作状态,并将该语音信号传送到该处理模块;步骤D该处理模块处理该语音信号;步骤E将该语音信号传送到该分派单元,并将该处理模块转换成备用状态,执行步骤A;步骤F将该语音信号传送到储存单元暂存;步骤G延迟一预设时间单位,执行步骤B。为了对本专利技术的特征、目的及功能有更进一步的认知与了解,下面结合附图以具体实例对本专利技术进行详细说明。附图说明图1是已知的语音处理流程图;图2是台湾公告第502207号的处理示意图;图3是本专利技术系统的架构图;图4是本专利技术方法的流程图;图5是本专利技术方法的另一实施例流程图。附图标记说明1语音输入单元;2语音处理单元;21前处理模块;22语音辨识模块;23语言模块;24分析模块;25语音合成模块;27分派模块;28储存模块;3语音输出单元;51-57本专利技术流程步骤;61-68本专利技术流程步骤。具体实施例方式本专利技术的精神在于利用一管理机制,管理每一个输入信号处理状态,尽量利用每一个处理模块,避免处理模块出现闲置的现象。请参阅图3所示的本专利技术的架构图。本专利技术提供一种语音输出/输入系统,包括有一语音输入单元1、一语音处理单元2、及一语音输出单元3,分述如下本专利技术语音输入单元1接收外界语音,以句子(sentence)为单位切出,输出为该语音信号。也就是说,语音输入单元所输出的语音信号是一个句子。根据统计,一个句子的长度约在4-8个字之间,比词的长度2-5个字稍长,在连续语音的辨认上并不会有技术上的困难。切音的方法很多,在一实施例中,可利用能量的高低来做判别是否有语音信号,以达成切音的功能。在另一实施例中,可利用越零率(zero-cross rate)来作为切音的参数,所谓的越零率就是语音信号与零准位交错的比率,可表示能量在该准位的波动情况。在另一实施例中,可利用语音信号能量的改变幅度来作为切音的参数。在另一实施例中,可以联合上述方式来达到切音的目的。本专利技术的语音处理单元2连接该语音输入单元1,处理该语音信号,输出一语音输出信号;该语音处理单元2还包括复数个语音处理模块,其中每一语音处理模块对该语音信号进行某一特定的处理,这些语音处理模块会依一预设顺序串接起来处理语音信号。在一实施例中,语音处理单元至少包括有一前处理模块21,去除语音信号中的噪声,还原该语音信号,以取得较佳的信号品质。在一实施例中,会利用低通滤波器去除高频噪声,利用LCP(linear coding processing)还原声道模型等。一语音辨识模块22,连接该前处理模块21,从经过前置处理的语音信号中撷取特征参数,再与事先已建好的语音模型比对,以辨识语音信号。一语言模块23,连接该语音辨识模块22,从辨识模块输出的结果是音,还不是有意义的字,因此需要经由语言模块23将辨识结果转换成有意义的文字信息。一分析模块24,连接该语言模块23,由该文字信息输出对应的一输出信息。及一语音合成模块25,连接该分析模块24,根据该输出信息输出该语音输出信号。一分派模块27,连接复数个语音处理模块,用以控制所有语音处理模块的处理流程。控制的方法如下每一语音处理模块通常为备用(standby)状态,当接收到分派模块27所传送的致能(enable)信号时,语音处理模块就转变为工作状态,每一语音处理模块以一语音信号为处理单位,处理该语音信号,在完成后恢复为备用状态,并通知分派模块27,可以指派本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音输出/输入系统,包括一语音输入单元,接收外界语音,输出一语音信号;一语音处理单元,连接该语音输入单元,处理该语音信号,输出一语音输出信号;该语音处理单元包括复数个语音处理模块,其中每一语音处理模块对该语音信号进行一特定处理,该复数个语音处理模块依一预设顺序处理该语音信号;及一分派模块,连接复数个语音处理模块,用以控制复数个语音处理模块的处理流程;以及一语音输出单元,连接该语音处理单元,播放该语音输出信号;其特征在于该语音输入单元将所接收的外界语音以句子(sentence)为单位切出,输出为该语音信号;每一语音处理模块通常为备用(standby)状态,当接收到该分派模块所传送致能(enable)信号时,转变为工作状态;每一语音处理模块以一语音信号为处理单位,处理该语音信号,完成后转变为备用状态,并通知该分派模块。2.如权利要求1所述的语音输出/输入系统,其中该语音处理单元更包括有一储存模块,连接该分派模块,当发生所指派的语音处理模块为工作状态时,暂存语音信号。3.如权利要求1.所述的语音输出/输入系统,其中语音处理模块至少包括一前处理模块,用以去除该语音信号的噪声,还原该语音信号,以取得较佳的信号品质;一语音辨识模块,连接该前处理模块,用以辨识该语音信号;一语言模块,连接该语音辨识模块,将所辨识的结果转换成一文字信息;一分析模块,连接该语言模块,由该文字信息输出对应的一输出信息;及一语音合成模块,连接该分析模块,根据该输出信息输出该语音输出信号至该语音输出单元。4.一种语音处理方法,用于一语音输出/输入装置,该语音输出/输入装置包括一语音输入单元,接收外界语音,以句子(sentence)为单位,输出复数个语音信号;复数个语音处理模块,其中该复数个语音处理模块依一预设顺序处理输入信息;一分派模块;一储存单元与一语音输出单元;该方法包括以下步骤步骤A该分派模块检验一语音信号是否已完成处理,若为是,输出结果至该语音输出单元播放,否则执行步骤B;步骤B该分派模块依该预设顺序检验该语音信号的下一个语音处理模块是否为备用状态?若为是,执行步骤C,否则执行步骤F;步骤C将该语音处理模块转换成工作状态,并将该语音信号传送到该语音处理模块;步骤D该语音处理模块处理该语音信号;步骤E将处理结果传送到该分派单元,并将该语音处理模块转换成备用状态,执行步骤A;步骤F将该语音...

【专利技术属性】
技术研发人员:赵平峡
申请(专利权)人:微星科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1