语音识别装置和语音识别方法制造方法及图纸

技术编号：3404764 阅读：233 留言：0更新日期：2012-04-11 18:40

本发明专利技术利用话筒１采集说话者发出的语音，通过Ａ／Ｄ变换器２提供给信号延迟单元３及声级推定单元４。声级推定单元４根据提供的数字语音信号进行声级推定值的计算。信号延迟单元３将延迟了预定的声级上升沿时间的数字语音信号提供给声级调整单元５，声级调整单元５根据声级推定值进行数字语音信号的声级调整，将声级调整后的输出提供给语音识别单元６，语音识别单元６根据提供的声级调整后的输出，进行语音识别。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及对说话者发出的语音进行识别的语音识别装置、语音识别方法及语音识别程序。
技术介绍
近年来，关于语音识别技术的发展非常迅速。所谓该语音识别，是指计算机或机械等自动理解人的语音。例如，通过利用该语音识别，使计算机或机械能够根据人的语音进行动作，或者能够使人的语音变换为文字。在语音识别中主要采用的方法是，抽取发出的语音所具有的频谱等物理特征，与预先存储的母音、子音或单词的物理特征模型进行比较。但是，在对许多不确定说话者进行语音识别时，由于说话者各自的个人差是造成语音所具有的物理特征差异的主要原因，因而不能进行正确的语音识别。另外，在对确定说话者进行语音识别时，也由于昼夜等周围环境的变化而产生的噪声(干扰)或者由于说话者身体状况等而引起语音所具有的物理特征的变化，成为进行语音识别时使识别率下降的主要原因，因而不能进行正确的语音识别。图13所示为进行语音识别时声级与识别率的关系的一个例子的示意图。图13所示的示意图中，纵轴表示识别率(％)，横轴表示声级(dB)。这里所谓声级意味着声能级，例如0dB是指负载电阻为600Ω，端电压为0.775V，功耗为1mW。...

【技术保护点】
一种语音识别装置，其特征在于，具有输入数字语音信号的输入手段、在利用所述输入手段输入的语音区间内根据一部分时间内的数字语音信号推定所述语音区间的声级的声级推定手段、根据利用所述声级推定手段推定的声级及预先设定的目标声级调整利用所述输入手段输入的所述语音区间的数字语音信号声级的声级调整手段。以及根据利用所述声级调整手段调整的数字语音信号进行语音识别的语音识别手段。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：川根友惠，金森丈郎，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人