语音识别方法和装置制造方法及图纸

技术编号：3047186 阅读：171 留言：0更新日期：2012-04-11 18:40

一种提高语音识别准确度并且避免增加资源的语音识别装置。根据声学分值和语言学分值选择可能为语音识别结果的词，同时还根据不是声学分值的测度，如“音素数目少”、“特定语音部分”、“包含在语音识别过去结果中”和“语言学分值高于预设值”，选择词。并且对如此选择的词进行匹配处理。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音识别方法和装置以及记录介质，特别涉及一种语音识别方法和装置以及记录介质，其中，甚至在语音包含具有不稳定声学特征值的词时，语音识别也可以用更少量的资源获得更高的准确度。
技术介绍
附图说明图1示出典型的传统语音识别装置。由用户发出的语音输入到麦克风1，麦克风1然后将所输入语音转换为作为电信号的语音信号。这些语音信号输入到A/D(analog/digital，模拟/数字)转换器2，A/D转换器2然后对作为模拟信号从麦克风1输出的语音信号进行采样和量化，以将这些信号转换为作为数字信号的语音数据。这些语音数据发送到特征值提取单元3。特征值提取单元3对来自A/D转换器2的语音数据以合适的所选帧进行逐帧的声学处理，以提取特征值，如MFCC(Mel Frequency CepstrumCoeffient，唛频率倒谱系数)，并将所提取的值发送到匹配单元4。另外，特征值提取单元3能够提取其他特征值，如频谱、线性预测系数或线谱对。使用来自特征值提取单元3的特征值，匹配单元4在必要时参考声学模型数据库5、词典数据库6和文法数据库7，根据例如连续分布(HIGHMOLECULAR MATERIALS，高分子材料)对输入到麦克风1的语音(输入语音)进行语音识别。也就是，声学模型数据库5存储表示声学特性，如正在识别语音的语言中的每个音素或音节，的声学模型。由于在此语音识别基于连续分布高分子材料方法，因此所使用的声学模型是高分子材料(隐马尔科夫模型)。词典数据库6记录表明正在识别的每个词(词汇)的发音信息(音素信息)的词典。文法数据库7存储表明登记在词典数据库6...

【技术保护点】
一种语音识别装置，其中计算反映输入语音的语音识别结果的声学可能性的分值，并且根据该分值识别语音，包括：提取装置，用于提取所述语音的特征值；选择装置，用于根据使用所述特征值计算的第一测度，从一组词中选择一个或更多第一词进行语音识别处理，并且根据不同于所述第一测度的第二测度选择一个或更多第二词；分值计算装置，用于计算由所述选择装置选择的所述第一和第二词的所述分值；最终确定装置，用于根据所述分值最终确定一个词串作为所述语音的识别结果。

【技术特征摘要】
JP 2000-2-28 51466/001.一种语音识别装置，其中计算反映输入语音的语音识别结果的声学可能性的分值，并且根据该分值识别语音，包括提取装置，用于提取所述语音的特征值；选择装置，用于根据使用所述特征值计算的第一测度，从一组词中选择一个或更多第一词进行语音识别处理，并且根据不同于所述第一测度的第二测度选择一个或更多第二词；分值计算装置，用于计算由所述选择装置选择的所述第一和第二词的所述分值；最终确定装置，用于根据所述分值最终确定一个词串作为所述语音的识别结果。2.如权利要求1所述的语音识别装置，其中，所述选择装置，以音素数作为所述第二测度，选择音素数满足预设条件的词作为所述第二词。3.如权利要求1所述的语音识别装置，其中，所述选择装置，以语音部分作为所述第二测度，选择语音部分满足预设条件的词作为所述第二词。4.如权利要求1所述的语音识别装置，其中，所述选择装置，以语言学可能性作为所述第二测度，选择语言学可能性满足预设条件的词作为所述第二词。5.如权利要求1所述的语音识别装置，进一步包括存储装置，用于存储语音识别结果；其中，所述选择装置，以所述存储装置中的存储状态作为所述第二测度，选择包含于存储在所述存储装置中的语音识别结果中的词作为所述第二词。6.如权利要求5所述的...

【专利技术属性】
技术研发人员：浅野康治，南野活树，小川浩明，赫尔穆特勒克，
申请(专利权)人：索尼公司，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人