【技术实现步骤摘要】
本专利技术涉及一种语音辨识系统及其词汇产生的方法与装置。特别是涉及一种词汇产生方法、装置及运用上述词汇产生方法的语音辨识系统,此词汇产生方法可增加语音辨识系统的弹性,使得使用者在不能准确的说出系统命令时,仍可以使用“未知的代称”来代替命令中不能确定的部分。
技术介绍
语音辨识系统可随着技术的精进,而让使用者非常方便地使用相关的设备,例如操作电视、音响等等电子设备器材。使用者只要根据系统所设定可辨识的语音指令,就可以非常方便地操作这些设备。除了运用在电气设备外,语音辨识的技术亦已广泛地运用在相关的领域中,例如身份辨识、语音输入等等的运用。然而,现行的语音辨识系统最常见的一个问题,在于使用者面对语音辨识系统时,往往不知道或是忘记如何对语音辨识系统下命令。然而,语音辨识系统所能辨识的范围,仅限于系统设计时所预定下的词汇以及语法。因此,使用者如无法确定系统所能接受的词汇,便无法享受语音系统的便利。由此可见,上述现有的语音辨识系统在词汇产生方法与使用上,显然仍存在有不便与缺陷,而亟待加以进一步改进。为了解决语音辨识系统存在的问题,相关厂商莫不费尽心思来谋求解决之道,但长久以来一直未见适用的设计被发展完成,而一般的语音辨识系统又没有适切的词汇产生方法能够解决上述问题,此显然是相关业者急欲解决的问题。有鉴于上述现有的语音辨识系统存在的缺陷,本专利技术人基于从事此类产品设计制造多年丰富的实务经验及专业知识,并配合学理的运用,积极加以研究创新,以期创设一种新的词汇产生装置、方法以及具有上述词汇产生装置的语音辨识系统,能够改进一般现有的语音辨识系统,使其更具有实用性。经过 ...
【技术保护点】
一种词汇产生装置,其特征在于其包括:一断词单元,用以接收多数个原始系统词汇,并进行断词(Tokenize)操作,并根据每个该原始系统词汇产生对应的多数含有意义的单位;一未知的代称数据库,用以储存多数个未知的代称;以及一词汇产生单元,连接到该断词单元与该未知的代称数据库,用以接收该些含有意义的单位以及该些未知的代称,并进行词汇合并操作,以便将该断词单元所产生该些含有意义的单位结合该些未知的代称而合成多数个新系统词汇。
【技术特征摘要】
1.一种词汇产生装置,其特征在于其包括一断词单元,用以接收多数个原始系统词汇,并进行断词(Tokenize)操作,并根据每个该原始系统词汇产生对应的多数含有意义的单位;一未知的代称数据库,用以储存多数个未知的代称;以及一词汇产生单元,连接到该断词单元与该未知的代称数据库,用以接收该些含有意义的单位以及该些未知的代称,并进行词汇合并操作,以便将该断词单元所产生该些含有意义的单位结合该些未知的代称而合成多数个新系统词汇。2.根据权利要求1所述的词汇产生装置,其特征在于其中所述的断词单元根据每个该原始系统词汇产生对应的该些含有意义的单位为多数个字。3.根据权利要求1所述的词汇产生装置,其特征在于其中所述的断词单元根据每个该原始系统词汇产生对应的该些含有意义的单位为多数个词。4.根据权利要求1所述的词汇产生装置,其特征在于其中所述的该些原始系统词汇是来自一语音辨识系统所原有的系统词汇数据库内的多数个系统词汇。5.根据权利要求1所述的词汇产生装置,其特征在于其中所述的该些未知的代称词汇是根据使用者所自行定义的多数个词汇。6.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是舍弃部分的含有意义的单位而以未知的代称所代替。7.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是将含有意义的单位的部分舍弃,并加入该未知的代称所代替。8.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是将含有意义的单位直接加入该未知的代称。9.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是将含有意义的单位直接加入多数个该些未知的代称。10.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是将含有意义的单位先行重组后直接加入该些未知的代称而产生该些新系统词汇。11.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,是省略部分有意义的单位后再进行重组以产生新的系统词汇。12.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,是将该些未知的代称加入以产生新的系统词汇。13.一种词汇产生方法,适用于一语音辨识系统,该语音辨识系统具有一原始系统词汇数据库,其特征在于其包括以下步骤将该原始系统词汇数据库内的多数个原始系统词汇进行断词(Tokenize)操作,并根据每个该原始系统词汇产生对应的多数含有意义的单位;将该些含有意义的单位以及该些未知的代称进行词汇合并操作,以便将该断词单元所产生该些含有意义的单位结合该些未知的代称而合成多数个新系统词汇,以提供该语音辨识系统用以进行语音辨识。14.根据权利要求13所述的词汇产生方法,其特征在于其中根据每个该原始系统词汇产生对应的该些含有意义的单位为多数个字。15.根据权利要求13所述的词汇产生方法,其特征在于其中根据每个该原始系统词汇产生对应的该些含有意义的单位为多数个词。16.根据权利要求13所述的词汇产生方法,其特征在于其中根据该些含有意义的单位以及该些未知的代称...
【专利技术属性】
技术研发人员:蔡锦和,黄良声,
申请(专利权)人:台达电子工业股份有限公司,
类型:发明
国别省市:71[中国|台湾]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。