语音识别设备和方法技术

技术编号:3890732 阅读:238 留言:0更新日期:2012-04-11 18:40
一种语音识别设备,包括存储词汇的存储单元,每个词汇包括复数个字体数据,通过从字或句子移除特定的字头来获得每个所述字体数据,以及存储至少一个包括被标记的节点的字头部分,以表示至少一个共同字头,所述共同字头对于所述词汇中的至少两个是共同的;指令接收单元,其接收目标词汇的指令和操作的指令;语法网络生成单元,当指示添加时,其生成包含所述字头部分、所述目标词汇和连接信息的语法网络,所述连接信息指示包含在所述目标词汇中的每个所述字体数据,被连接至包含在所述字头部分中的所述被标记的节点中的特定的一个;以及语音识别单元,其使用所生成的语法网络执行语音识别。

【技术实现步骤摘要】

本专利技术涉及语音识别设备和语音识别方法。 背景絲作为与语音识别设备相关的技术,可使用生成用于语音识别的语法的 技术。这里提到的语法(或语音识别语法)表示通过它提供一个或更多语 音识别目标词汇的数据或信息。这里提到的词汇表示一组字或句子。语音 识别设备将执行语音识别时通过语法提供的一个或更多词汇中的每一个看 作语音识别目标词汇。作为语法生成技术之一,可用的方法是通过组合与情况对应的词汇(例 如,对应于设备的状态或模式)来生成语法。作为具体实例,将描述在车 辆导航系统中语音识别语法的生成方法的实例。在车辆导航系统中,在刚 刚打开电源之后的模式下(即,初始条件),语法仅包括用于车辆导航操 作命令的词汇。当在初始条件下用户输入命令时,其他模式被选择(例如, 地图检索模式或电话号码检索模式)。当实现所选模式时,与其他模式固 有的操作种类对应的一个或更多词汇被添加到初始条件下的语法中。此后, 依据进行了从哪个模式到哪个模式的转换,在所迷转换和/或一个或更多不 必要的词汇被从中删除之前,将一个或更多必要的词汇添加到语法。在上文描述的实例中,语音识别语法仅是一组词汇。这里,假设语法为X,预先准备的词汇是Xi至Xn。当从&至Xn选择k个词汇《Xu,Xi2,…XnJ时,语法X-W…+Xik。如果从k个词汇(Xu,Xi2,…XnJ选择了将 要删除的m个词汇{ Xdl, Xd2,...Xdm},则可通过X — X - Xdl - Xd2 - ... - Xdm 的删除搮作来更新语法。作为更普通的情况,考虑其中句型被预先确定并且该句中的一个或更 多词汇是可变的语法。这里,将日语句型"Xno Y (X的Y),,作为实例 来说明。在该"XnoY"的句型实例中,可以在X中设置用于X的任意词 汇,并且可以在Y中设置用于Y的任意词汇,例如,如果分别将X和Y 设置为(KANREN陽GAISHA( affiliate company,联营公司),KOGAISHA (subsidiary company,子公司))和(JUSHO (地址),DENWABANGO (电话号码)},则获得用于表示4个句子"KANREN-GAISHA no JUSHO (联营公司的地址)"、"DENWABANGO no KANREN-GAISHA (联 营公司的电话号码)"、"KOGAISHA no JUSHO (子公司的地址),,、 "KOGAISHA no DENWABGANGO (子公司的电话号码)"的语法。而 且在该实例中,类似于前述车辆导航系统的实例,通it^预先准备的词汇 选择一些词汇,以及操作以组合所选词汇(操作以添加),例如X-Xu十 Xi2+... + Xim, Y-Y"+Yi2+…+Yin,和/或操作以删除词汇,来实现语法 的生成和更新。作为用于表达语音识别中使用的词汇的方法,可使用以网络表达词汇 的方法(参见例如,Stephen E. Levinson: "Structural Methods in Automatic Speech Recognition" , IEEE ^H义录的73巻,No.ll, 1625 - 1650页,1985 年ll月)。当4吏用词汇网络时,也可发生词汇的添加/删除。作为执行词汇网络的添加/删除的传统方法,可使用考虑合并复数个字 的共同的字头(common word head,共同字头)以及合并复数个字的共同 字尾(common word tail,共同字尾)的方法。通过合并共同字头/共同字 尾,可减少存储量和计算量。然而,该方法具有的问题是,需要相对更多的计算时间用于考虑了合并的处理。另一方面,作为用于执行词汇网络的添加/删除的另一方法,存在一种将复数个词汇网^彼此并联连接的方法。该方法具有另一问题,即尽管 处理简单,但是与考虑共同字头/共同字尾的合并的情况相比,需要更多的 存储量和计算量。如上文所述,还没有有效地执行词汇的添加/删除的方法。
技术实现思路
根据本专利技术的一方面,提供一种使用提供一组识别目标字或句子的语法网络的语音识别设备,包括存储单元,被配置为存储多个词汇,每个 所述词汇包括多个字体数据,通过从任意字或句子移除特定的字头来获得 每个所述字体数据,以及被配置为存储至少一个包括多个标记节点的字头 部分,以侵束示至少一个共同字头,所述共同字头对于所述多个词汇中的 至少两个是共同的;指令接收单元,被配置为接收来自所述多个词汇的用 于逸择目标词汇的第一指令,以及用于指示对所述目标词汇的操作内容的 第二指令;语法网络生成单元,被配置为当通过所述第一指令指示添加所 述目标词汇的处理时,生成包含所述字头部分、通过所述第二指令选择的 所述目标词汇和字头部分侧连接信息的语法网络,所述字头部分侧连接信 息指示每个包含在所述目标词汇中的所述多个字体数据,被连接至包含在所述字头部分的所述多个标记节点的预先匹配的一个;以及语音识别单元, 被配置为使用生成的语法网g行语音识别。附图说明图i是示出根据实施例的语音识别设备的配置实例的示图2是示出语法编辑单元的内部配置的实例的示图3是示出从词汇操作到记录的处理过程的实例的流程图4是示出语法框架的实例的示图5是示出字头部分和字尾部分的示图6是示出词汇网络的第一实例(字体部分)的示图7是示出词汇网络的第二实例(字体部分)的示图;图8是示出词汇网络的第三实例(字体部分)的示图9是示出语法网络生成的处理过程的实例的流程图IO示出图9中的附加例程的处理过程的实例;图11示出图9中的删除例程的处理过程的实例;图12示出通过初始设置过程处理的语法框架的网络结构;图13是示出对其执行附加例程的语法框架的网络结构实例的示图14是示出语法框架的另一实例的示图15是示出可用于两个子网络的字体部分的结构实例的示图16是示出语法网络生成的处理过程的另一实例的流程图17是示出图16中的附加例程的处理过程实例的流程图18是示出图16中的删除例程的处理过程实例的流程图19是示出字头部分的另一实例的示图20是示出词汇网络的第四实例(字体部分)的示图21是示出词汇网络的第五实例(字体部分)的示图22是示出词汇网络的笫六实例(字体部分)的示图23是示出语法编辑单元的内部配置的另一实例的示图24是示出用于更新字头部分的处理过程实例的流程图25是示出图24中的合并例程的处理过程实例的流程图26是示出图25中的合并例程的处理过程实例的流程图27是说明传统词汇网络的添加操作/删除操作的第 一示图28是说明传统词汇网络的添加操作/删除操作的第二示图29是说明传统词汇网络的添加操作/删除操作的第三示图30是说明传统词汇网络的添加操作/删除操作的第四示图;以及图31是说明传统词汇网络的添加操作/删除操作的第五示图。下文中,将参考附图描述本专利技术的实施例。 (第一实施例)首先,将描述用网络表达词汇的方法,而且将基于该表达方法详细描 述现有技术的问题。通常,用网络表达语音识别中使用的词汇具有下列两个优点。(i) 具有共同字头的不同的字可共享共同字头的数据(网络的节点和 弧(are)),和/或具有共同字尾的不同的字可共享共同字尾的数据。因 此,可以更小的存储量保存词汇。(ii) 通过共享共同字头和/或共同字尾,可共享语本文档来自技高网
...

【技术保护点】
一种使用提供一组识别目标字或句子的语法网络的语音识别设备,包括: 存储单元,被配置为存储多个词汇,每个所述词汇包括多个字体数据,通过从任意字或句子移除特定的字头来获得每个所述字体数据,以及存储至少一个包括多个被标记的节点的字头部分,以 便表示至少一个共同字头,所述共同字头对于所述多个词汇中的至少两个是共同的; 指令接收单元,被配置为接收第一指令,用于从所述多个词汇选择目标词汇,以及第二指令,用于指示对所述目标词汇的操作的内容; 语法网络生成单元,被配置为当通过 所述第一指令指示用于添加所述目标词汇的处理时,生成包含所述字头部分、通过所述第二指令选择的所述目标词汇以及字头部分侧连接信息的语法网络,所述字头部分侧连接信息指示包含在所述目标词汇中的每个所述多个字体数据,被连接至包含在所述字头部分中的所述多个被标记的节点中的预先匹配的一个;以及 语音识别单元,被配置为使用所生成的语法网络执行语音识别。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:馆森三庆田中信一
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1