词汇产生装置、方法以及具有上述词汇产生装置的语音辨识系统制造方法及图纸

技术编号:3045760 阅读:181 留言:0更新日期:2012-04-11 18:40
本发明专利技术是关于一种词汇产生装置、方法以及具有上述词汇产生装置的语音辨识系统,该词汇产生方法可产生新的系统词汇,以增加语音辨识系统的弹性,使得使用者在不能准确的说出系统命令时,可以使用本发明专利技术特别定义的一种“未知的代称”(Unknown  Code  Word)来代替命令中不能确定的部分。

【技术实现步骤摘要】

本专利技术涉及一种语音辨识系统及其词汇产生的方法与装置。特别是涉及一种词汇产生方法、装置及运用上述词汇产生方法的语音辨识系统,此词汇产生方法可增加语音辨识系统的弹性,使得使用者在不能准确的说出系统命令时,仍可以使用“未知的代称”来代替命令中不能确定的部分。
技术介绍
语音辨识系统可随着技术的精进,而让使用者非常方便地使用相关的设备,例如操作电视、音响等等电子设备器材。使用者只要根据系统所设定可辨识的语音指令,就可以非常方便地操作这些设备。除了运用在电气设备外,语音辨识的技术亦已广泛地运用在相关的领域中,例如身份辨识、语音输入等等的运用。然而,现行的语音辨识系统最常见的一个问题,在于使用者面对语音辨识系统时,往往不知道或是忘记如何对语音辨识系统下命令。然而,语音辨识系统所能辨识的范围,仅限于系统设计时所预定下的词汇以及语法。因此,使用者如无法确定系统所能接受的词汇,便无法享受语音系统的便利。由此可见,上述现有的语音辨识系统在词汇产生方法与使用上,显然仍存在有不便与缺陷,而亟待加以进一步改进。为了解决语音辨识系统存在的问题,相关厂商莫不费尽心思来谋求解决之道,但长久以来一直未见适用的设计被发展完成,而一般的语音辨识系统又没有适切的词汇产生方法能够解决上述问题,此显然是相关业者急欲解决的问题。有鉴于上述现有的语音辨识系统存在的缺陷,本专利技术人基于从事此类产品设计制造多年丰富的实务经验及专业知识,并配合学理的运用,积极加以研究创新,以期创设一种新的词汇产生装置、方法以及具有上述词汇产生装置的语音辨识系统,能够改进一般现有的语音辨识系统,使其更具有实用性。经过不断的研究、设计,并经反复试作及改进后,终于创设出确具实用价值的本专利技术。
技术实现思路
本专利技术的目的在于,克服现有的语音辨识系统存在的缺陷,而提供一种新的词汇产生装置、方法以及具有上述词汇产生装置的语音辨识系统,所要解决的技术问题是使其可以增加语音辨识系统的弹性,使得使用者在不能准确的说出系统命令时,可以使用本专利技术特别定义的一种“未知的代称”(Unknown Code Word)来代替命令中不能确定的部分,从而更加适于实用。本专利技术的目的及解决其技术问题是采用以下技术方案来实现的。为了达到前述专利技术目的,本专利技术提出一种词汇产生装置,包括断词单元、未知的代称数据库与词汇产生单元。此断词单元用以接收多数个原始系统词汇,并进行断词(Tokenize)操作,并根据每个原始系统词汇产生对应的多数含有意义的单位。此未知的代称数据库用以储存多数个未知的代称。此词汇产生单元连接到断词单元与未知的代称数据库,用以接收上述含有意义的单位以及未知的代称,并进行词汇合并操作,以便将断词单元所产生上述的含有意义的单位结合未知的代称而合成多数个新系统词汇。本专利技术的目的及解决其技术问题还可采用以下技术措施进一步实现。上述的词汇产生装置,其中断词单元根据每个原始系统词汇产生对应的含有意义的单位为多数个字或词。上述的词汇产生装置,其中原始系统词汇是来自一语音辨识系统所原有的系统词汇数据库内的多数个系统词汇。上述的词汇产生装置,其中词汇产生单元将接收含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是舍弃部分的含有意义的单位而以部分的未知的代称所代替。上述的词汇产生装置,其中词汇产生单元将接收含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是将含有意义的单位的部分舍弃,并加入未知的代称所代替。上述的词汇产生装置,其中词汇产生单元将接收含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是将含有意义的单位直接加入一个或多个未知的代称。上述的词汇产生装置,其中词汇产生单元将接收含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是将含有意义的单位先行重组后直接加入未知的代称而产生新系统词汇。上述的词汇产生装置,在一实施例中,亦可省略部分有意义的单位后再进行重组,甚至加入未知的代称以产生新的系统词汇。为达上述的目的,本专利技术提出一种词汇产生方法,适用于一语音辨识系统,而此语音辨识系统具有一原始系统词汇数据库。此方法包括将原始系统词汇数据库内的多数个原始系统词汇进行断词(Tokenize)操作,并根据每个原始系统词汇产生对应的多数含有意义的单位。而后将含有意义的单位以及未知的代称进行词汇合并操作,以便将断词单元所产生含有意义的单位结合未知的代称而合成多数个新系统词汇,以提供语音辨识系统用以进行语音辨识。本专利技术的目的及解决其技术问题还可采用以下技术措施进一步实现。上述的词汇产生方法,其中根据每个原始系统词汇产生对应的含有意义的单位为多数个字或词。在一实施例中,上述的词汇产生方法,其中根据含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是舍弃部分的含有意义的单位而以未知的代称所代替。或是将含有意义的单位的部分舍弃,并加入未知的代称所代替。在一实施例中,是将含有意义的单位直接加入该未知的代称。在一实施例中,是将含有意义的单位直接加入多数个该些未知的代称。在另一实施例中,是将含有意义的单位先行重组后直接加入一个或多个未知的代称而产生新系统词汇。为达上述的目的,本专利技术提出一种具有词汇产生方法的语音辨识系统,包括原始系统词汇数据库、未知的代称数据库、断词单元与词汇产生单元。此原始系统词汇数据库用以储存多数个原始系统词汇。此未知的代称数据库用以储存多数个未知的代称。此断词单元,用以接收上述的原始系统词汇,并进行断词(Tokenize)操作,并根据每个原始系统词汇产生对应的多数含有意义的单位。而词汇产生单元连接到断词单元与未知的代称数据库,用以接收含有意义的单位以及未知的代称,并进行词汇合并操作,以便将断词单元所产生含有意义的单位结合未知的代称而合成多数个新系统词汇。本专利技术的目的及解决其技术问题还可采用以下技术措施进一步实现。上述的语音辨识系统,在一实施例中,其词汇产生单元将接收含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是舍弃部分的含有意义的单位而以未知的代称所代替。上述的语音辨识系统,在一实施例中,其词汇产生单元将接收含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是将含有意义的单位的部分舍弃,并加入未知的代称所代替。上述的语音辨识系统,在一实施例中,其词汇产生单元将接收含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是将含有意义的单位直接加入一个或多个未知的代称。上述的语音辨识系统,在一实施例中,其词汇产生单元将接收含有意义的单位以及未知的代称进行词汇合并操作,以产生新系统词汇是将含有意义的单位先行重组后直接加入未知的代称而产生新系统词汇。本专利技术与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本专利技术特殊的词汇产生装置、方法以及具有上述词汇产生装置的语音辨识系统,可以增加语音辨识系统的弹性,使得使用者在不能准确的说出系统命令时,可以使用本专利技术特别定义的一种“未知的代称”(Unknown CodeWord)来代替命令中不能确定的部分,从而更加适于实用。其具有上述诸多的优点及实用价值,并在同类方法中未见有类似的设计公开发表或使用而确属创新,其不论在方法上或功能上皆有较大的改进,在技术上有较大的进步,本文档来自技高网
...

【技术保护点】
一种词汇产生装置,其特征在于其包括:一断词单元,用以接收多数个原始系统词汇,并进行断词(Tokenize)操作,并根据每个该原始系统词汇产生对应的多数含有意义的单位;一未知的代称数据库,用以储存多数个未知的代称;以及一词汇产生单元,连接到该断词单元与该未知的代称数据库,用以接收该些含有意义的单位以及该些未知的代称,并进行词汇合并操作,以便将该断词单元所产生该些含有意义的单位结合该些未知的代称而合成多数个新系统词汇。

【技术特征摘要】
1.一种词汇产生装置,其特征在于其包括一断词单元,用以接收多数个原始系统词汇,并进行断词(Tokenize)操作,并根据每个该原始系统词汇产生对应的多数含有意义的单位;一未知的代称数据库,用以储存多数个未知的代称;以及一词汇产生单元,连接到该断词单元与该未知的代称数据库,用以接收该些含有意义的单位以及该些未知的代称,并进行词汇合并操作,以便将该断词单元所产生该些含有意义的单位结合该些未知的代称而合成多数个新系统词汇。2.根据权利要求1所述的词汇产生装置,其特征在于其中所述的断词单元根据每个该原始系统词汇产生对应的该些含有意义的单位为多数个字。3.根据权利要求1所述的词汇产生装置,其特征在于其中所述的断词单元根据每个该原始系统词汇产生对应的该些含有意义的单位为多数个词。4.根据权利要求1所述的词汇产生装置,其特征在于其中所述的该些原始系统词汇是来自一语音辨识系统所原有的系统词汇数据库内的多数个系统词汇。5.根据权利要求1所述的词汇产生装置,其特征在于其中所述的该些未知的代称词汇是根据使用者所自行定义的多数个词汇。6.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是舍弃部分的含有意义的单位而以未知的代称所代替。7.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是将含有意义的单位的部分舍弃,并加入该未知的代称所代替。8.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是将含有意义的单位直接加入该未知的代称。9.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是将含有意义的单位直接加入多数个该些未知的代称。10.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,以产生该些新系统词汇是将含有意义的单位先行重组后直接加入该些未知的代称而产生该些新系统词汇。11.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,是省略部分有意义的单位后再进行重组以产生新的系统词汇。12.根据权利要求1所述的词汇产生装置,其特征在于其中所述的词汇产生单元将接收该些含有意义的单位以及该些未知的代称进行词汇合并操作,是将该些未知的代称加入以产生新的系统词汇。13.一种词汇产生方法,适用于一语音辨识系统,该语音辨识系统具有一原始系统词汇数据库,其特征在于其包括以下步骤将该原始系统词汇数据库内的多数个原始系统词汇进行断词(Tokenize)操作,并根据每个该原始系统词汇产生对应的多数含有意义的单位;将该些含有意义的单位以及该些未知的代称进行词汇合并操作,以便将该断词单元所产生该些含有意义的单位结合该些未知的代称而合成多数个新系统词汇,以提供该语音辨识系统用以进行语音辨识。14.根据权利要求13所述的词汇产生方法,其特征在于其中根据每个该原始系统词汇产生对应的该些含有意义的单位为多数个字。15.根据权利要求13所述的词汇产生方法,其特征在于其中根据每个该原始系统词汇产生对应的该些含有意义的单位为多数个词。16.根据权利要求13所述的词汇产生方法,其特征在于其中根据该些含有意义的单位以及该些未知的代称...

【专利技术属性】
技术研发人员:蔡锦和黄良声
申请(专利权)人:台达电子工业股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利