当前位置: 首页 > 专利查询>王瑞璋专利>正文

一种语音辨识系统技术方案

技术编号:3048202 阅读:162 留言:0更新日期:2012-04-11 18:40
一种语音辨识系统,包括至少一语音辨识引擎以及一显示装置,且于该显示装置上设有一讯号指示界面以及一文字输出界面。其中,该讯号指示界面是借助波形以显示一录音状态、一语音辨识进行中状态、或一完成语音辨识的状态。而该文字输出界面,用于显示语音辨识的文字结果。其中,于讯号指示界面上每个波形单元以及于文字输出界面上每一个词单元则分别与一组回馈调整选项组相连接,供使用者选取指令,用以修正错误的辨识结果以及调整语音辨识系统。本发明专利技术适用于桌上型计算机、笔记型计算机、家用多媒体系统、电视、DVD、影音系统、手机或个人数字助理等有图形显示接口的电子装置之语音辨识系统。

【技术实现步骤摘要】

本专利技术涉及语音辨识领域,特别涉及一种供使用者选取指令以更正语音辨 识错误,或调整语音辨识系统
技术介绍
在现今许多电子装置的使用方面,语音辨识技术的发展为使用者提供更为 便捷的路径。无论桌上型电脑、笔记型电脑、手机或个人数位助理器或其它电 子装置,其输入都必须依赖视觉与肢体的合作,以达到操控的目的。举例而言, 当使用者操控电脑时,则必须借助键盘、鼠标或其它附属控制装置的协助,以 完成指令的输入。或使用触碰式荧幕以简化输入程序,然而,由于荧幕显示面 积有限,且仍需使用手指进行操作,仍无法达到最大便利性。上述问题对于一 般人而言或许仅造成不便,况且对于肢体障碍,患有神经肌肉疾病甚或失去视 觉的使用者而言,将使其难以操作上述电子装载。而语音辨识技术正可解决此 等问题。语音辨识的应用方面,使用者仅需借助音讯输入装置,例如麦克风,将其 语音输入供语音辨识系统辨识,而后输出欲输入语音相对应的文字,或进一步 根据所得的语音辨识结果直接进行指令操作。在使用者辨识系统时,如上所述,使用者必须经由一音讯输入装置将声音 输入并录制,然后开始辨识过程。在录音以及辨识过程中,存有许多因素将影 响最终语音辨识的结果,例如所使用的音讯输入装置种类,录音的环境、与音讯输入装置的距离等。因此,对于录音以及辨识过程的监控,实有其需要。对 此,习知技术或使用不同图象来分别显示录音状态以及辨识状态,或利用一图 像的变化以显示录音或辨识状态。然而,在显示状态的同时,无法反映出录音 或辨识结果品质的优劣或录音过程是否成功。此外,对于语音辨识的结果,习知技术或有提供若干可根据辨识结果所做 的调整功能,然而大半仅需针对整体语音辨识结果所设,因此往往无法仅针对 该语音辨识结果中的某部分进行调整,以回馈进而锐化语音辨识系统的功能, 使其能更符合个别使用者的需求。例如个别使用者在某些字或词的发音有其 特殊的腔调,若无法针对该等字、词的语音辨识结果进行回馈、调整,则势必 将无法提供适合个别使用者的语音辨识系统,进而大幅减弱其实际运用的效能。
技术实现思路
本专利技术要解决的技术问题在于提供一种语音辨识系统,本专利技术能有效反映 录音或辨识结果品质的优劣或录音过程是否成功,能针对该语音辨识结果中的 某部分进行调整,以回馈进而锐化语音辨识系统,且更符合个别使用者的需求。本专利技术还提供一种具备错误更正回馈调整机制之语音辨识系统, 以提供使用者可有效的更正语音辨识错误,或可回馈调整语音辨识系 统。本专利技术的技术方案通过以下方式实现 一种语音辨识系统,包括至少一语 音辨识引擎以及一显示装置,且于该显示装置上设有讯号指示界面,是用波 形代表使用者输入的语音讯号,并显示录音状态、语音辨识进行中状态以及语 音辨识完成状态;文字输出界面,用于显示语音辨识的文字结果,且该文字结 果包括至少一个词单元。在本专利技术所提供的系统中,所述讯号指示界面上所显示的录音状态、语音 辨识进行中状态以及语音辨识完成状态的波形分别以不同颜色显示。在本专利技术所提供的系统中,所述文字输出界面上语音辨识的文字结果的每 一个词单元,是分别以不同颜色代表每一个词单元的语音辨识品质。在本专利技术所提供的系统中,所述每一个词单元是以绿色、黄色或红色显示 其中绿色表示有良好的语音辨识品质;黄色代表警告有不良的语音辨识品质; 红色代表具有很差的语音辨识品质,需要严格检视并更正之。在本专利技术所提供的系统中,所述每一个词单元是与回馈调整选项组相连接;该选项组包含至少一个回馈调整选项,供使用者选取以更正语音辨识的错误, 或回馈调整语音辨识系统。在本专利技术所提供的系统中,所述与该显示装置上的一鼠标光标移动至欲回 馈调整之词单元上,或经由触控笔或鼠标按压点击,而将该回馈调整选项组显 示于该显示装置上。在本专利技术所提供的系统中,所述与该词单元相连接的回馈调整选项组所包 含的回馈调整选项是列出下一笔候选词、依据语音相似度优先列出语音辨 识候选词、依据词相连优先列出候选词、列出全部近似辨识结果、改为 手写输入、改为键盘输入或以上任意组合。在本专利技术所提供的系统中,所述讯号指示界面上语音辨识完成状态的波形 还包括至少一个波形单元,每一波形单元是与文字输出界面所显示语音辨识结 果的一个词单元相对应,且彼此是以相互对齐的方式排列,并以相同的颜色来表示该词单元的语音辨识品质。在本专利技术所提供的系统中,所述讯号指示界面上的波形单元是与回馈调整选项组相连接;该选项组包含至少一个回馈调整选项,供使用者重听录音,更正录音,更正语音辨识的错误,或回馈调整语音辨识系统。在本专利技术所提供的系统中,所述使用者是通过将显示在该显示装置上之一 的鼠标光标移动至欲回馈调整之波形单元上,或经由触控笔或鼠标按压点击, 而将该回馈调整选项组显示于该显示装置上。在本专利技术所提供的系统中,所述回馈调整选项组所包含的回馈调整选项包 括播放、重录、纳入训练、改为手写输入、改为键盘输入或以 上任意组合。在本专利技术所提供的系统中,所述系统是具有显示装置,或可连接其他显示 装置,或在遥控器上具有显示装置的桌上型电脑、笔记型电脑、家用多媒体系 统、电视、DVD、影音系统、手机或个人数位助理器。在本专利技术所提供的系统中,所述词单元是词,次词或是片语。本专利技术相对与现有技术具有以下优点1、 通过本专利技术所提供的利用波形代表使用者语音讯号的语音辨识系统,使 用者可即时判断录音过程是否成功以及所输入语音讯号的品质。2、 通过本专利技术所提供的变化波形颜色的语音辨识系统,使用者得以便利地 监控语音处理的速度以及语音辨识结果的品质。3、 通过本专利技术所提供的一种语音辨识系统,使用者得以词为单元针对所输 入的语音讯号以及语音辨识结果的文字进行错误更正或系统的回馈调整,从而 便利的完成文字输入工作,或持续改善该语音辨识系统的效能。附图说明图l是本专利技术语音辨识系统的示意图2是本专利技术语音辨识系统第一实施例的示意图; 图3是本专利技术语音辨识系统第一实施例的另一示意图;图4是本专利技术语音辨识系统第一实施例的另一示意图; 图5是本专利技术语音辨识系统第一实施例的使用状态图; 图6是本专利技术语音辨识系统第一实施例的另一使用状态图。具体实施例方式下面结合实施例及附图对本专利技术作进一步详细的描述。 实施例如图1所示,本专利技术语音辨识系统包括至少一语音辨识引擎10以及一显示装置20,且于该显示装置20上设有讯号指示界面30以及文字输出界面40。其 中,该讯号指示界面30是用波形32代表使用者输入的语音讯号,并显示录音 状态以及语音辨识状态。而该文字输出界面40,则是用于显示语音辨识结果的 文字42,而该文字结果包括至少一个词单元。显示于讯号指示界面30上的波形 32是用于显示使用者输入的语音讯号,而显示于文字输出界面40上的文字42 则为上述语音讯号辨识后所得的结果。此外,本专利技术语音辨识系统的显示装置20可以是桌上型电脑、笔记型电脑、 家用多媒体系统、电视、DVD、影音系统、手机或个人数位助理器的显示荧 幕,或遥控器上的显示荧幕。如图2所示,在录音过程时,使用者经由一音讯输入装置(未显示于图中, 例如一麦克风)输入语音于语音辨识系统内,其输入的语音讯号将以波形32显 示于讯号指示界面30上。波形使用具有两个优势其一,使用者在录音过程可 通过观察波形的变化而获知本文档来自技高网
...

【技术保护点】
一种语音辨识系统,包括至少一语音辨识引擎以及一显示装置,且于该显示装置上设有: 讯号指示界面,是用波形代表使用者输入的语音讯号,并显示录音状态、语音辨识进行中状态以及语音辨识完成状态; 文字输出界面,用于显示语音辨识的文字结果, 且该文字结果包括至少一个词单元。

【技术特征摘要】
1、一种语音辨识系统,包括至少一语音辨识引擎以及一显示装置,且于该显示装置上设有讯号指示界面,是用波形代表使用者输入的语音讯号,并显示录音状态、语音辨识进行中状态以及语音辨识完成状态;文字输出界面,用于显示语音辨识的文字结果,且该文字结果包括至少一个词单元。2、 如权利要求1所述的语音辨识系统,其特征在于,所述讯号指示界面 上所显示的录音状态、语音辨识进行中状态以及语音辨识完成状态的波形分别 以不同颜色显示。3、 如权利要求l所述的语音辨识系统,其特征在于,所述文字输出界面 上语音辨识的文字结果的每一个词单元,是分别以不同颜色代表每一个词单元 的语音辨识品质。4、 如权利要求3所述的语音辨识系统,其特征在于,所述每一个词单元 是以绿色、黄色或红色显示其中绿色表示有良好的语音辨识品质;黄色代表 警告有不良的语音辨识品质;红色代表具有很差的语音辨识品质,需要严格检 视并更正之。5、 如权利要求3所述的语音辨识系统,其特征在于,所述每一个词单元 是与回馈调整选项组相连接;该选项组包含至少一个回馈调整选项,供使用者 选取以更正语音辨识的错误,或回馈调整语音辨识系统。6、 如权利要求5所述的语音辨识系统,其特征在于,所述使用者是通过 将显示与该显示装置上的一鼠标光标移动至欲回馈调整之词单元上,或经由触控笔或鼠标按压点击,而将该回馈调整选项组显示于该显示装置上。7、 如权利要求5所述的语音辨识系统,其特征在于,所述与该词单元相连接的回馈调整选项组所包含的回馈调整选项是列出下一笔候...

【专利技术属性】
技术研发人员:王瑞璋
申请(专利权)人:王瑞璋王中平
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1