语音识别设备、语音识别方法、会话控制设备以及会话控制方法技术

技术编号：3046529 阅读：179 留言：0更新日期：2012-04-11 18:40

一种自动会话设备包括：语音识别装置（２００），接收语音信号并输出与语音信号对应的字符／字符串作为识别结果；语音识别词典存储装置（７００），存储用于确定对应于语音信号的多个候选的语言模型；会话数据库装置（５００），存储多条话题指定信息；语句分析装置（４００），分析从语音识别装置（２００）输出的字符／字符串；和会话控制装置（３００），存储会话历史记录，并根据语句分析装置（４００）的分析而获取应答语句。语音识别装置（２００）包括：单词对照装置（２００Ｃ），参照语音识别词典存储装置（７００）而输出多个候选；和候选确定装置（２００Ｅ），参照会话数据库装置（５００），将单词对照装置输出的多个候选与对应于会话历史记录的话题指定信息进行比较，并根据该比较输出一个候选。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种。更具体地，本专利技术涉及可以利用过去的会话历史记录等，优先选择符合或者与过去会话的话题相关联的候选的。
技术介绍
作为在连续语音识别中识别特定词汇的传统方法，已经开发出了从连续的会话语音中提取预先设定的识别候选单词的单词辨识技术(wordspotting)。已经确定，如果需要设定的单词数目较少，则利用该方法可以有效地提取单词。然而，已经知道提取的精度会随着要设定的单词数目增加而降低。此外，由于利用该方法不能识别所设定的单词以外的任何单词，因此，该方法不能用于需要对词汇进行连续语音识别的应用。因此，需要一种在大词汇量连续语音识别的框架中主要识别大量指定单词的方法。语音识别是根据所观测到的语音信号来推定说话者所讲的内容。如果说话者已讲了某个单词，并且通过特征提取已得到一特征参数x，则只需根据模式识别理论来计算使后验概率p(w|x)最大的w。通常，由于难于直接地找到后验概率p(w|x)，因此根据贝叶斯(Bayes)定理(p(w|x)＝p(x|w)p(w)/p(x))来计算使p(x|w)p(w)最大的w(在此情况中，p(x)不随w而变化)，而不是找出使后验概率p(w|x)最大的w。根据以音素(phoneme)等为单位的声学模型，预先由通过学习而获得的数据计算出p(x|w)，作为特征参数的出现几率。根据以单词等为单位的语言模型来计算p(w)。作为大词汇量连续语音识别的框架，已经确定，使用音素隐马尔可夫模型(Hidden Markov Model)和统计语言模型对所输入的语音信号的似然度进行计算和比较的方法是有效的。通常，作为统计语言模型，通常...

【技术保护点】
一种语音识别设备，其具有：语音识别装置（２００）；语音识别词典存储装置（７００）；会话数据库装置（５００），其中存储有多条话题指定信息的；以及会话历史记录存储装置（３００），其存储在过去的会话中包含的主题，所述语音识别设备的特征在于：　　所述语音识别装置（２００）根据所述语音识别词典存储装置中存储的内容，选择与语音信号对应的多个候选，在所选择的多个候选中选择出对应于与所述会话历史记录存储装置（３００）中存储的会话历史记录相关联的话题指定信息的一个候选，并且输出该候选作为识别结果。

【技术特征摘要】
JP 2003-6-20 177356/20031.一种语音识别设备，其具有语音识别装置(200)；语音识别词典存储装置(700)；会话数据库装置(500)，其中存储有多条话题指定信息的；以及会话历史记录存储装置(300)，其存储在过去的会话中包含的主题，所述语音识别设备的特征在于所述语音识别装置(200)根据所述语音识别词典存储装置中存储的内容，选择与语音信号对应的多个候选，在所选择的多个候选中选择出对应于与所述会话历史记录存储装置(300)中存储的会话历史记录相关联的话题指定信息的一个候选，并且输出该候选作为识别结果。2.一种语音识别设备，其具有语音识别装置(200)，其接收语音信号；语音识别词典存储装置(700)，在其中存储有用于确定与所述语音信号对应的多个候选的语言模型；会话数据库装置(500)，在其中存储有多条话题指定信息；以及会话历史记录存储装置(300)，其存储会话历史记录，所述语音识别设备的特征在于所述语音识别装置(200)具有单词对照装置(200C)，其根据所输入的语音信号，参照所述语音识别词典存储装置(700)而输出多个候选；以及候选确定装置(200E)，其参照所述会话数据库装置(500)，将从所述单词对照装置(200C)输出的所述多个候选与对应于所述会话历史记录的所述话题指定信息进行比较，并且根据所述比较的结果输出一个候选作为识别结果。3.根据权利要求2所述的语音识别设备，其特征在于，所述候选确定装置(200E)参照所述会话数据库装置(500)，将所述多个候选与对应于会话历史记录的话题指定信息进行比较，判断在所述多个候选中是否存在与对应于所述会话历史记录的所述话题指定信息匹配的候选，如果存在与所述话题指定信息匹配的候选，则输出该候选作为识别结果。4.根据权利要求3所述的语音识别设备，其特征在于，所述语音识别设备还包括候选缩减装置(200F)，其中作为所述多个候选与对应于所述会话历史记录的所述话题指定信息的比较结果，如果不存在与所述话题指定信息匹配的候选，则所述候选确定装置(200E)请求所述候选缩减装置(200F)来缩减所述多个候选，并且所述候选缩减装置(200F)响应于所述请求而输出所述多个候选中的具有最大似然度的候选作为识别结果。5.根据权利要求2至4中任何一项所述的语音识别设备，其特征在于，所述会话数据库装置(500)存储有与会话的主题相关的第一话题指定信息以及与会话的主题不相关的第二话题指定信息，并且所述候选确定装置(200E)将所述多个候选与对应于会话历史记录的所述第一话题指定信息进行比较，并输出所述多个候选中的任何一个候选作为识别结果。6.一种语音识别方法，用于输出与所输入的语音相对应的字符或者字符串作为识别结果，所述语音识别方法的特征在于所述语音识别方法包括以下步骤根据从所输入的语音获得的语音信号，分析声学特征；根据所述声学特征输出多个候选；获得与预先存储的会话历史记录对应的话题指定信息；以及将所述多个候选与所获得的话...

【专利技术属性】
技术研发人员：黄声扬，胜仓裕，
申请(专利权)人：PtoPA株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人