语音识别对话装置制造方法及图纸

技术编号:3046698 阅读:188 留言:0更新日期:2012-04-11 18:40
一种语音识别对话装置,对输入的语音进行分析以与登录的语音数据模式进行比较从而识别语音并根据识别的语音进行应答,其特征在于,它备有:语音分析装置,语音识别装置,计时装置,应答内容级别产生装置,应答内容生成装置,用于根据来自上述语音识别部的识别数据决定与来自上述应答内容级别产生装置的应答级别相对应的应答内容,并输出与此对应的应答内容数据;语音合成装置,用于根据来自该应答内容生成装置的应答内容数据输出与该应答内容数据对应的语音合成数据;语音输出装置,用于将来自该语音合成装置的输出向外部发出。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及识别语音和进行与识别结果对应的发话及特定动作的语音识别对话装置
技术介绍
作为这种语音识别对话装置的一个例子有语音识别玩具。例如,在日本专利特开昭6-142342号公开的语音识别玩具中,将构成语音指令的多个指令字作为识别对象语音预先登录下来,将使用该玩具游戏的儿童所发出的语音信号与登录的语音信号进行比较,当上述两语音信号一致时,输出对语音指令规定的电信号,以此为基础使玩具进行特定的动作。但是,在现有的根据这种语音识别结果进行会话和动作的布制的等玩具中,错误地识别讲话者的话语的情况很多,一般,即使是正确地识别了单词和语句也不能根据状态和环境的变化作出反应和进行回答。近来,即使是玩具也要求它能完成高难度的动作,例如,如果当孩子们向布娃娃说“早上好”时不管什么时间只知道回答说“早上好”,孩子们就会厌烦了。而且,由于这种语音识别对话技术有可能应用于面向更高年级学生的游戏机、进而应用于日常生活中的设备,所以希望开发更高的技术。
技术实现思路
本专利技术的目的在于实现一种语音识别对话装置,该装置具有检测时间等的状态和环境变化的功能,可以根据状态和环境的变化响应用户发出的语音,并有可能进行更高级的对话。本专利技术的语音识别对话装置,对输入的语音进行分析以与登录的语音数据模式进行比较从而识别语音、并根据识别的语音进行应答,其特征在于具有语音分析装置、变动数据检出装置、系数设定装置、语音识别装置、语音合成装置和语音输出装置。语音分析装置对输入的语音进行分析生成语音数据模式,变动数据检测部检出对对话内容产生影响的变动数据,系数设定装置输入该变动数据检测部的变动数据、对预先登录的每一次识别对象语音的内容产生与上述变动数据对应的加权系数,语音识别装置在输入从上述语音分析装置输出的语音数据模式的同时、从上述系数设定装置得到该时刻的相对于登录的多个识别对象语音的各自的加权系数、计算出考虑了与各个识别对象语音的识别数据分别对应的加权系数之后的最终识别数据、由所求出的这些最终识别数据识别上述输入语音、将识别的语音的最终识别数据输出,语音合成装置数据来自该语音识别装置的考虑了上述系数之后的最终识别数据输出与其对应的语音合成数据,语音输出装置将来自该语音合成装置的输出向外部发出。上述变动数据检测装置例如是检测时钟数据的计时装置,上述系数设定装置是对预先登录的各识别对象语音的每一项内容产生与时间对应的加权系数的装置。这时的系数设定装置也可以这样来输出加权系数,即,当某个输入语音是在过去已正确地识别的几个时刻中的最多的那个时刻输入的时,则使该识别数据的加权系数取最大值,与该时刻相隔越远,使上述加权系数取越小的值。本专利技术的语音识别对话装置,对输入的语音进行分析以与登录的语音数据模式进行比较从而识别语音,并根据识别的语音进行应答,其特征在于具有语音分析装置、语音识别装置、计时装置、应答内容级别产生装置、应答内容级别存储装置、应答内容生成部、语音合成装置和语音输出装置。语音分析装置对输入的语音信号进行分析、生成语音数据模式,语音识别装置根据从该语音分析装置输出的语音数据模式输出与上述输入语音对应的识别数据,计时装置产生时间数据,应答内容级别产生装置输入该计时装置的时间数据和由上述语音识别装置正确识别的识别次数数据中的至少1个数据、根据输入的数据产生用于改变对输入语音的应答内容的应答内容级别,应答内容级别存储装置存储由上述应答内容级别产生装置得到的与时间对应的应答级别,应答内容生成部根据来自上述语音识别部的识别数据决定与来自上述应答内容级别产生装置的应答级别相对应的应答内容,并输出与其对应的应答内容数据,语音合成装置根据来自该应答内容生成部的应答内容数据输出与该应答内容数据对应的语音合成数据,语音输出装置将来自该语音合成装置的输出向外部发出。本专利技术的语音识别对话装置,对输入的语音进行分析以与登录的语音数据模式进行比较从而识别语音,并根据识别的声音进行应答,其特征在于具有语音分析装置、语音识别装置、变动数据检出装置、应答内容生成装置、语音合成装置和语音输出装置。语音分析装置对输入的语音进行分析并生成语音数据模式,语音识别装置根据从该声音分析装置输出的语音数据模式输出对上述输入语音的识别数据,变动数据检出装置检出影响对话内容的变动数据,应答内容生成装置输入来自该变动数据检出装置的变动数据和来自上述语音识别部的识别数据,根据该识别数据输出考虑了上述变动数据的内容的应答内容数据,语音合成装置根据来自该应答内容生成装置的应答内容数据输出与该应答内容数据对应的语音合成数据,语音输出装置将该语音合成装置来的输出向外部发出。上述变动数据检测装置是测定使用环境的温度并输出该温度数据的温度传感器,上述应答内容生成装置输出考虑了该温度数据的应答内容数据。上述变动数据检测装置还是测定使用环境的气压并输出该气压数据的气压传感器,上述应答内容生成装置输出考虑了该气压数据的应答内容数据。上述变动数据检测装置还是检测日历数据输出该日历数据的日历检出装置,上述应答内容生成装置输出考虑了该日历数据的应答内容数据。本专利技术随着影响对话内容的变动数据(例如,时间、气温、天气、日期等)的变化,对预先登录的识别对象语音的每1个识别数据设定加权系数。例如,若变动数据为时间,则与时间相对应对识别对象语音的每一个识别数据设定加权系数,通过进行考虑了该加权系数的语音识别,可以进行考虑了讲话者的语言(特别是问候语)在时间上是否合理的声音识别。因此,即使出现与声音分析后的声音模式相似的识别对象语音时,通过加权系数也可以使最终输出的识别数据的数值之差增大,从而可以提高识别率。不仅是时间,对上述种种的变动数据都是可能的,例如,通过根据气温设定加权系数,可以进行考虑了问候语在气温上是否合理的语音识别,这时,即使出现与声音分析后的声音模式相似的识别对象语音时,与上述一样通过加权系数也可以使最终输出的识别数据的数值之差增大,从而可以提高识别率。此外,当变动数据是时间时,对某1个语句,检出使用该语句的频度高的时间,使该使用频度高的时刻时的加权系数值最大、距离该时间越远系数值愈小,由此便可以得到与实际使用状态相符合的语句与时间的关系。还有,随着时间的推移等产生改变对输入语音的应答内容的应答内容级别,根据来自语音识别部的识别数据决定与上述应答内容级别相应的应答内容,进行与之相应的应答,所以,可以使对讲话者问询的应答内容级别发生变化。进而,使用来自温度传感器、气压传感器的数据和日历数据等变动数据,根据这些数据生成应答内容,由此可以使应答内容在很宽范围内变化,从而可以进行内容更加充实的对话。附图说明图1是本专利技术第1实施例的布制玩具狗的整体结构框图。图2是本专利技术第2实施例的整体结构框图。图3是本专利技术第3实施例的整体结构框图。图4是本专利技术第4实施例的整体结构框图。图5是本专利技术第5实施例的整体结构框图。图6是本专利技术第6实施例的整体结构框图。1...话筒2...语音分析部3...时钟部4...系数设定部5...语音识别部6...语音合成部7...驱动控制部8...扬声器9...电源部10...操作机构11...电机12...凸轮13...凸杆14...轴15...曲柄16...狗的下颚21...系数存储部31...本文档来自技高网...

【技术保护点】
一种语音识别对话装置,对输入的语音进行分析以与登录的语音数据模式进行比较从而识别语音并根据识别的语音进行应答,其特征在于,它备有:    语音分析装置,用于对输入的语音信号进行分析、生成语音数据模式;    语音识别装置,用于根据从该语音分析装置输出的语音数据模式输出上述输入语音的识别数据;    计时装置,用于产生时间数据;    应答内容级别产生装置,用于输入该计时装置的时间数据和由上述语音识别装置正确识别的识别次数数据中的至少1个数据,根据输入的数据产生用于改变对输入语音的应答内容的应答内容级别;    应答内容级别存储装置,用于存储由上述应答内容级别产生装置得到的应答级别;    应答内容生成装置,用于根据来自上述语音识别部的识别数据决定与来自上述应答内容级别产生装置的应答级别相对应的应答内容,并输出与此对应的应答内容数据;    语音合成装置,用于根据来自该应答内容生成装置的应答内容数据输出与该应答内容数据对应的语音合成数据;    语音输出装置,用于将来自该语音合成装置的输出向外部发出。

【技术特征摘要】
JP 1995-12-18 329352/95;JP 1995-3-1 42005/951.一种语音识别对话装置,对输入的语音进行分析以与登录的语音数据模式进行比较从而识别语音并根据识别的语音进行应答,其特征在于,它备有语音分析装置,用于对输入的语音信号进行分析、生成语音数据模式;语音识别装置,用于根据从该语音分析装置输出的语音数据模式输出上述输入语音的识别数据;计时装置,用于产生时间数据;应答内容级别产生装置,用于输入该计时装置的时间数据和由上述语音识别装置正确识别的识别次数数据中的至少1个数据,根据输入的数据产生用于改变对输入语音的应答内容的应答内容级别;应答内容级别存储装置,用于存储由上述应答内容级别产生装置得到的应答级别;应答内容生成装置,用于根据来自上述语音识别部的识别数据决定与来自上述应答内容级别产生装置的应答级别相对应的应答内容,并输出与此对应的应答内容数据;语音合成装置,用于根据来自该应答内容生成装置的应答内容数据输出与该应答内容数据对应的语音合成数据;语音输出装置,用于将来自该语音合成装置的输出向外部发出。2.一种语音识别对话装置,对输入的语音进行分析,以与登录的语音数据模...

【专利技术属性】
技术研发人员:枝常伊佐央
申请(专利权)人:精工爱普生株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1