用于激活和/或进行语音对话的装置、系统和方法制造方法及图纸

技术编号:5200632 阅读:173 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及用于激活和/或进行语音对话的一种装置、一种系统和一种方法。根据本发明专利技术的用于激活和/或进行语音对话的装置具有语音识别单元、讲话者识别单元以及决策单元。该决策单元设计用于取决于语音识别单元和讲话者识别单元的结果激活结果行为。

【技术实现步骤摘要】

本专利技术涉及用于激活语音对话和/或进行语音对话的一种装置、一种系统和一种 方法。
技术介绍
语音对话系统用于电子仪器、例如车辆电脑,而不需要对触觉的操作运行进行控 制。根据现有技术已知,用于进行语音对话或用于激活语音对话的装置根据指令搜索通过 噪声抑制或回波补偿而变得清晰的语音信号。在用于激活语音对话的装置中,根据确定的 关键词进行搜索,该关键词用于激活语音对话。在用于进行语音对话的装置中,检查该语音 信号是否包含作为指令而存储在集成于语音对话系统中的指令数据库中的单词。如果识别 出指令,那么执行属于该命令的行为。尤其在干扰噪声作用于系统的应用条件下,这样的用于进行语音对话或用于激活 语音对话的装置是不可靠的。这尤其在应用于轿车中时是不利的,因为在干扰影响下、例如 乘客的谈话,根据现有技术的装置常常由于错误识别的命令而执行不期望的功能。
技术实现思路
因此本专利技术的目的在于,特别抗干扰地进行语音对话和/或激活语音对话。该目的通过一种根据权利要求1所述的装置和一种根据权利要求19所述的方法 实现。在从属权利要求中给出有利的改进方案。指令分析的可靠性通过如下方式显著提高,即该装置不仅包本文档来自技高网...

【技术保护点】
一种用于激活语音对话和/或进行语音对话的装置(1;30),尤其应用在车辆内部空间中,所述装置具有:-至少一个用于语音信号(8;37)的输入端;-语音识别单元(24;31),用于确定在输入的所述语音信号中是否包含以及包含哪些指令;以及-在输入端方面与所述语音识别单元的输出端连接的决策单元(29;32),所述决策单元适于取决于在所述语音信号(8;37)中识别出的指令执行结果行为(26),其特征在于,-所述装置附加地包括讲话者识别单元(14);-所述讲话者识别单元适于根据所述语音信号和至少一个存储的讲话者模型确定当前的讲话者;-其中所述决策单元附加地在输入端方面与所述讲话者识别单元连接并这样设计,即...

【技术特征摘要】
DE 2009-10-30 102009051508.91.一种用于激活语音对话和/或进行语音对话的装置(1 ;30),尤其应用在车辆内部空间中,所述装置具有-至少一个用于语音信号(8 ;37)的输入端;-语音识别单元04 ;31),用于确定在输入的所述语音信号中是否包含以及包含哪些 指令;以及-在输入端方面与所述语音识别单元的输出端连接的决策单元09 ;32),所述决策单 元适于取决于在所述语音信号(8;37)中识别出的指令执行结果行为06),其特征在于,-所述装置附加地包括讲话者识别单元(14);-所述讲话者识别单元适于根据所述语音信号和至少一个存储的讲话者模型确定当前 的讲话者;-其中所述决策单元附加地在输入端方面与所述讲话者识别单元连接并这样设计,即 取决于所述指令的所述结果行为06)的激活至少在一些指令中取决于,是否将所述指令 鉴定为来自对应于所述讲话者模型的讲话者。2.根据权利要求1所述的装置,其特征在于,所述决策单元09;32)设计用于把所述 讲话者识别单元(14)和所述语音识别单元04 ;31)的结果与之前存储在使用者模型中的、 针对讲话者的信息相比较和相联系,其中如果所述当前的讲话者未被授权执行所述结果行 为,则抑制至少一个取决于指令的结果行为的执行。3.根据权利要求1或2所述的装置,其特征在于,所述决策单元09;32)这样设计,即 不取决于对应于所述讲话者模型的所述讲话者的所述识别来执行一些指令。4.根据权利要求1至3中任一项所述的装置,其特征在于,所述装置设计为用于进行语 音对话和激活语音对话的组合装置。5.根据权利要求1至4中任一项所述的装置,其特征在于,语音分析单元04;31)包 括用于识别单词的单词识别单元(19)以及后续的、用于识别构成指令的结构的结构分析 单元01)。6.根据权利要求1至5中任一项所述的装置,其特征在于,回波补偿单元(9)紧邻或 非紧邻地前置于所述讲话者识别单元(14)和/或所述语音识别单元04 ;31),其中所述回 波补偿单元(9)具有一个或多个用于扬声器信号(10 ;34)的、尤其是用于处理单声道_、立 体声-和/或多声道-扬声器信号(10 ;34)的输入端,以及设计用于补偿所述扬声器信号 (10 ;34)对所述语音信号(8 ;37)的影响。7.根据权利要求6所述的装置,其特征在于,所述回波补偿单元(9)具有用于补偿其他 人的语音分量的子单元(38),所述子单元有利地与至少一个用于连接附加的麦克风(36) 的输入端连接。8.根据前述权利要求中任一项所述的装置,其特征在于,噪声抑制单元(1 紧邻或非 紧邻地前置于所述讲话者识别单元(14)和/或所述语音识别单元04 ;31)。9.根据权利要求1至8中任一项所述的装置,其特征在于,所述讲话者识别单元(14) 和/或所述语音识别单元04 ;31)设计用于使通过所述讲话者识别单元(14)识别的所述 讲话者向所述决策单元位9 ;32)的输出与由所述语音识别单元04 ;31)识别的指令的输 出同步。10.根据权利要求1至9中任一项所述的装置,其特征在于,所述讲话者识别单元(14) 设计用于通过从所述语音信号中提取讲话者特征并把所述讲话者特征与存储的取决于讲 话者的特征相比较来鉴定所述当前的讲话者,以及所述讲话者识别单元有利地包括另外的 单元(20),所述另外的单元设计用于讲话者适应,也就是说用于不断确定的细化的取决于 讲话者的特征以及用于把所述细化的取决于讲话者的特征存储在存储的所述讲话者模型 中。11.根据权利要求1至10中任一项所述的装置,其特征在于,并联于所述讲话者识别单 元(14)和所述语音识别单元04 ;31)布置了用于根据所述语音信号(8 ;37)检测驾驶员的 状态的驾驶员状态检测单元(39)。12.根据权利要求1至11中任一项所述的装置,其特征在于,所述语音识别单元包括附 加单元(18),所述附加单元设计用于检测所述讲话者的所述讲话者特征的取决于时间的变 化作为属性并将所述变化存储在对应于所述讲话者存储的所述讲话者模型中。13.根据权利要求1至12中任一项所述的装置,其特征在于,所述装置具有至少一个 存储装置(17),所述存储装置尤其可以设计用于存储所述使用者模型和/或所述讲话者模 型。14.根据权利要求13所述的装置,其特征在于,所述至少一个存储装置(17)具有用于 输出和/或输入存储的所述讲话者模型和/或所述使用者模型的输入端和/或输出端。15.根据前述权利要求中任一项所述的装置,其特征在于,所述装置这样设计,即在所 述结果行为06)的所述执行期间也激活所述装置以用于...

【专利技术属性】
技术研发人员:哈尔罗赫普肯卡尔海因茨克诺布尔戴维肯普夫汉斯威廉吕尔
申请(专利权)人:大陆汽车有限责任公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利